ナッシュ均衡へ高速に収束する学習アルゴリズムとは?
関連論文 16件
オンライン環境で意思決定をしながら効率的に学習するには?
関連論文 6件
言語モデルの出力を人間の選好にどう整合させるか?
関連論文 7件
逐次的な意思決定において、方策をどう改善・評価するか?
関連論文 5件
限られた資源や機会を公平に配分するには?
関連論文 4件