↓ メインコンテンツへスキップ

研究テーマ

研究テーマ

Learning Dynamics and Equilibrium Computation in Games

ナッシュ均衡へ高速に収束する学習アルゴリズムとは？

関連論文 17件

テーマを見る →

研究テーマ

Bandits and Online Learning

オンライン環境で意思決定をしながら効率的に学習するには？

関連論文 6件

テーマを見る →

研究テーマ

Language Model Alignment and Preference Optimization

言語モデルの出力を人間の選好にどう整合させるか？

関連論文 7件

テーマを見る →

研究テーマ

Reinforcement Learning and Sequential Decision Making

逐次的な意思決定において、方策をどう改善・評価するか？

関連論文 5件

テーマを見る →

研究テーマ

Fairness in Recommender Systems and Allocation

限られた資源や機会を公平に配分するには？

関連論文 4件

テーマを見る →