People

坂本充生
Mitsuki Sakamoto
2022年に電気通信大学大学院修士課程を修了。
2023年にリサーチエンジニアとしてサイバーエージェントに中途入社。強化学習に関する研究開発に従事。
発表論文
-
Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games
論文誌・国際会議
AISTATS 2023
-
二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束
国内学会/セミナー
FIT 2022
-
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
国内学会/セミナー
JSAI 2022
-
Mutation-Driven Follow the Regularized Leader for Last-Iterate Convergence in Zero-Sum Games
論文誌・国際会議
UAI 2022
-
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
国内学会/セミナー
情報処理学会 第84回全国大会
-
クールノー競争におけるマルチエージェント強化学習に関する研究
国内学会/セミナー
情報処理学会 第84回全国大会
-
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
国内学会/セミナー
IBIS 2021
-
見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究
国内学会/セミナー
FIT 2021
-
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
国内学会/セミナー
日本オペレーションズ・リサーチ学会 2021年 秋季研究発表会