メインコンテンツへスキップ
  1. 研究テーマ/

Learning Dynamics and Equilibrium Computation in Games

ナッシュ均衡へ高速に収束する学習アルゴリズムとは?

本テーマでは、ゲームの均衡を計算する学習アルゴリズムを研究する。特に、更新される戦略そのものがナッシュ均衡へ収束するようなアルゴリズムの構築を目指す。その一環として、利得摂動を用いて学習ダイナミクスを安定化する方法を扱う。

研究の焦点
#

  • 学習アルゴリズムはどのようにしてナッシュ均衡へ高速に収束できるか
  • 利得摂動を用いて学習ダイナミクスをどのように安定化できるか
  • マルチエージェントの学習ダイナミクスはいつ収束しないのか

関連論文