本テーマでは、逐次的な意思決定問題において、方策を改善する方法や、その性能を評価する方法を扱う。
研究の焦点
#- 高い報酬、あるいは目標とする報酬を得るために、方策をどのように改善できるか
- 方策が目標とする性能水準に達しているかをどのように評価できるか
関連論文
AISTATS 2026
Kaito Ariu, Po-An Wang, Alexandre Proutiere, Kenshi Abe
テーマ:Reinforcement LearningNeurIPS 2025 Workshop on Aligning Reinforcement Learning Experimentalists and Theorists
Kaito Ariu, Po-An Wang, Alexandre Proutiere, Kenshi Abe
テーマ:Reinforcement LearningTransactions on Machine Learning Research
Tsunehiko Tanaka, Kenshi Abe, Kaito Ariu, Tetsuro Morimura, Edgar Simo-Serra
テーマ:Reinforcement LearningReinforcement Learning Conference (RLC) 2024
Tetsuro Morimura, Kazuhiro Ota, Kenshi Abe, Peinan Zhang
テーマ:Reinforcement LearningNeurIPS 2021 Workshop on Deep Reinforcement Learning
Masahiro Kato, Kei Nakagawa, Kenshi Abe, Tetsuro Morimura
テーマ:Reinforcement Learning