People

阿部 拳之
Kenshi Abe
発表論文
-
Exploration of Unranked Items in Safe Online Learning to Re-Rank
論文誌・国際会議
SIGIR2023
-
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium
論文誌・国際会議
IJCAI 2023
-
Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games
論文誌・国際会議
AISTATS 2023
-
二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束
国内学会/セミナー
FIT 2022
-
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
国内学会/セミナー
JSAI 2022
-
Fair Matrix Factorisation for Large-Scale Recommender Systems
論文誌・国際会議
RecSys 2022 FAccTRec Workshop
-
Mutation-Driven Follow the Regularized Leader for Last-Iterate Convergence in Zero-Sum Games
論文誌・国際会議
UAI 2022
-
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
国内学会/セミナー
情報処理学会 第84回全国大会
-
クールノー競争におけるマルチエージェント強化学習に関する研究
国内学会/セミナー
情報処理学会 第84回全国大会
-
Anytime Capacity Expansion in Medical Residency Match by Monte Carlo Tree Search
論文誌・国際会議
IJCAI 2022
-
Computing Strategies of American Football via Counterfactual Regret Minimization
論文誌・国際会議
AAAI 2022 Workshop on Reinforcement Learning in Games
-
Thresholded Lasso Bandit
論文誌・国際会議
ICML 2022
-
Off-Policy Exploitability-Evaluation in Two-Player Zero-Sum Markov Games
論文誌・国際会議
AAMAS 2021
-
Mean Variance Efficient Reinforcement Learning
論文誌・国際会議
NeurIPS workshop on Deep Reinforcement Learning
-
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
国内学会/セミナー
IBIS 2021
-
反実仮想後悔最小化によるアメリカンフットボールにおけるオフェンス戦略の均衡推定
国内学会/セミナー
FIT 2021
-
見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究
国内学会/セミナー
FIT 2021
-
見間違えのある繰り返しゲームのためのActor-Critic型強化学習
国内学会/セミナー
日本オペレーションズ・リサーチ学会 2021年 秋季研究発表会
-
二人零和マルコフゲームにおけるオフ方策評価のためのQ学習
国内学会/セミナー
第25回ゲームプログラミングワークショップ
-
広告配信オークションにおける入札戦略
国内学会/セミナー
FIT 2020
-
Online Learning for Bidding Agent in First Price Auction
論文誌・国際会議
AAAI 2020 Workshop on Reinforcement Learning in Games