メインコンテンツへスキップ
  1. 研究テーマ/

Reinforcement Learning and Sequential Decision Making

逐次的な意思決定において、方策をどう改善・評価するか?

本テーマでは、逐次的な意思決定問題において、方策を改善する方法や、その性能を評価する方法を扱う。

研究の焦点
#

  • 高い報酬、あるいは目標とする報酬を得るために、方策をどのように改善できるか
  • 方策が目標とする性能水準に達しているかをどのように評価できるか

関連論文