メインコンテンツへスキップ

プロフィール

サイバーエージェント AI Lab にて、ゲームの均衡を計算するための学習アルゴリズムを中心に研究しています。特に、更新される戦略そのものがナッシュ均衡へ収束するようなアルゴリズムの構築や、利得摂動を用いた学習ダイナミクスの安定化に関心があります。

学歴

  • 博士(工学) 電気通信大学(情報理工学研究科 情報学専攻) · 2023.4 – 2025.12
  • 修士(工学) 東京工業大学(総合理工学研究科 知能システム科学専攻) · 2015.4 – 2017.3
  • 学士(工学) 東京工業大学(工学部 制御システム工学科) · 2011.4 – 2015.3

主要論文
#

論文一覧を見る

発表
#

Adaptively Perturbed Mirror Descent for Learning in Games

ICML 2024 著者発表会 · 2024/7/10

ゲーム理論とオンライン学習

第38回人工知能学会全国大会(JSAI 2024) · 企画セッション「機械学習が紡ぐゲーム理論のフロンティア」 · 2024/5/29

広告配信オークションにおける入札戦略

第19回情報科学技術フォーラム (FIT 2020) · 2020/9/1

多人数不完全情報ゲームにおけるAI開発

日本経済学会 2020年度春季大会 · 2020/5/30

技術記事
#

【ゲーム理論】展開型ゲームのナッシュ均衡を計算しよう:Counterfactual Regret Minimizationの解説

【Unity ML-Agents】 Self-Play Reinforcement Learningで対戦ゲームのAIを作ってみた

Q-Learningがどの程度Off-Policyなのかを調べてみた

ミニ花札のAIを作ってみよう

遺伝的アルゴリズムでコードフォーマッタのスタイルを最適化する

max k-armed banditとは?

Successive Halvingの性能解析