阿部拳之

サイバーエージェント AI Lab にて、ゲームの均衡を計算するための学習アルゴリズムを中心に研究しています。特に、更新される戦略そのものがナッシュ均衡へ収束するようなアルゴリズムの構築や、利得摂動を用いた学習ダイナミクスの安定化に関心があります。

主要論文
#

ICML 2026 Oral

Asymmetric Perturbation in Solving Bilinear Saddle-Point Optimization

Kenshi Abe, Mitsuki Sakamoto, Kaito Ariu, Atsushi Iwasaki

テーマ:Learning in Games

arXiv

ICLR 2025

Boosting Perturbed Gradient Ascent for Last-Iterate Convergence in Games

Kenshi Abe, Mitsuki Sakamoto, Kaito Ariu, Atsushi Iwasaki

テーマ:Learning in Games

arXiv

ICML 2024

Adaptively Perturbed Mirror Descent for Learning in Games

Kenshi Abe, Kaito Ariu, Mitsuki Sakamoto, Atsushi Iwasaki

テーマ:Learning in Games

arXiv

AISTATS 2023

Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games

Kenshi Abe, Kaito Ariu, Mitsuki Sakamoto, Kentaro Toyoshima, Atsushi Iwasaki

テーマ:Learning in Games

arXiv

論文一覧を見る

発表
#

不完全情報ゲームAIを支えるゲーム理論的技術の進展

第40回人工知能学会全国大会（JSAI 2026） · 企画セッション「学習理論におけるゲーム理論のフロンティア」 · 2026/6/13

不完全情報ゲームの均衡学習

第39回人工知能学会全国大会（JSAI 2025） · 企画セッション「学習理論におけるゲーム理論のフロンティア」 · 2025/5/28

Adaptively Perturbed Mirror Descent for Learning in Games

ICML 2024 著者発表会 · 2024/7/10

ゲーム理論とオンライン学習

第38回人工知能学会全国大会（JSAI 2024） · 企画セッション「機械学習が紡ぐゲーム理論のフロンティア」 · 2024/5/29

Learning in games: ゲーム理論とオンライン学習

Algorithmic Learning & Optimization 勉強会#1 · 2023/6/24

二人零和マルコフゲームにおけるオフ方策評価

AAMAS2021 著者発表会 · 2021/5/27

広告配信オークションにおける入札戦略

第19回情報科学技術フォーラム (FIT 2020) · 2020/9/1

多人数不完全情報ゲームにおけるAI開発

日本経済学会 2020年度春季大会 · 2020/5/30

多人数不完全情報ゲームにおけるAI ~ポーカーと麻雀を例として~

第43回強化学習アーキテクチャ勉強会 · 2019/8/20

技術記事
#

【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう：Counterfactual Regret Minimizationの解説

【Unity ML-Agents】 Self-Play Reinforcement Learningで対戦ゲームのAIを作ってみた

Q-Learningがどの程度Off-Policyなのかを調べてみた

ミニ花札のAIを作ってみよう

遺伝的アルゴリズムでコードフォーマッタのスタイルを最適化する

max k-armed banditとは？

Successive Halvingの性能解析

主要論文#

Asymmetric Perturbation in Solving Bilinear Saddle-Point Optimization

Boosting Perturbed Gradient Ascent for Last-Iterate Convergence in Games

Adaptively Perturbed Mirror Descent for Learning in Games

Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games

発表#

技術記事#

主要論文
#

発表
#

技術記事
#