坂本充生 | CyberAgent AI Lab

People

坂本充生

Mitsuki Sakamoto

2022年に電気通信大学大学院修士課程を修了。

2023年にリサーチエンジニアとしてサイバーエージェントに中途入社。強化学習に関する研究開発に従事。

発表論文

Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games

論文誌・国際会議

Kenshi Abe, Kaito Ariu, Mitsuki Sakamoto, Kentaro Toyoshima, Atsushi Iwasaki

AISTATS 2023
二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束

国内学会/セミナー

豊島健太郎, 坂本充生, 阿部拳之, 岩崎敦

FIT 2022
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究

国内学会/セミナー

坂本充生, 豊島健太郎, 阿部拳之, 岩崎敦

JSAI 2022
Mutation-Driven Follow the Regularized Leader for Last-Iterate Convergence in Zero-Sum Games

論文誌・国際会議

Kenshi Abe, Mitsuki Sakamoto, Atsushi Iwasaki

UAI 2022
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究

国内学会/セミナー

坂本充生, 阿部拳之, 岩崎敦

情報処理学会第84回全国大会
クールノー競争におけるマルチエージェント強化学習に関する研究

国内学会/セミナー

豊島健太郎, 坂本充生, 阿部拳之, 岩崎敦

情報処理学会第84回全国大会
見間違えのある繰り返しゲームのためのActor-Critic型強化学習

国内学会/セミナー

坂本充生, 阿部拳之, 岩崎敦

IBIS 2021
見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究

国内学会/セミナー

坂本充生, 阿部拳之, 岩崎敦

FIT 2021
見間違えのある繰り返しゲームのためのActor-Critic型強化学習

国内学会/セミナー

坂本充生, 阿部拳之, 岩崎敦

日本オペレーションズ・リサーチ学会 2021年秋季研究発表会