Research

International Conference

Riku Togashi, Kenshi Abe, Yuta Saito.
Scalable and Provably Fair Exposure Control for Large-Scale Recommender Systems
WWW 2024. [paper]
Hakuei Yamada, Junpei Komiyama, Kenshi Abe, Atsushi Iwasaki.
Learning Fair Division from Bandit Feedback
AISTATS 2024. [Paper]
Yuma Fujimoto, Kaito Ariu, Kenshi Abe.
Memory Asymmetry Creates Heteroclinic Orbits to Nash Equilibrium in Learning in Zero-Sum Games
AAAI 2024. [Paper]
Hiroaki Shiino, Kaito Ariu, Kenshi Abe, Togashi Riku.
Exploration of Unranked Items in Safe Online Learning to Re-Rank
SIGIR 2023 (Short Paper). [Paper]
Yuma Fujimoto, Kaito Ariu, Kenshi Abe.
Learning in Multi-Memory Games Triggers Complex Dynamics Diverging from Nash Equilibrium
IJCAI 2023. [Paper]
Kenshi Abe, Kaito Ariu, Mitsuki Sakamoto, Kentaro Toyoshima, Atsushi Iwasaki.
Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games
AISTATS 2023. [paper]
Riku Togashi, Kenshi Abe.
Fair Matrix Factorisation for Large-Scale Recommender Systems
RecSys 2022 FAccTRec Workshop. [paper]
Kenshi Abe, Mitsuki Sakamoto, Atsushi Iwasaki.
Mutation-Driven Follow the Regularized Leader for Last-Iterate Convergence in Zero-Sum Games
UAI 2022. [paper]
Kaito Ariu, Kenshi Abe, Alexandre Proutière.
Thresholded LASSO Bandit
ICML 2022. [paper]
Kenshi Abe, Junpei Komiyama, Atsushi Iwasaki.
Anytime Capacity Expansion in Medical Residency Match by Monte Carlo Tree Search
IJCAI 2022. [paper]
Yuki Shimano, Kenshi Abe, Atsushi Iwasaki, Kazunori Ohkawara.
Computing Strategies of American Football via Counterfactual Regret Minimization
AAAI 2022 Workshop on Reinforcement Learning in Games (Oral Presentation). [paper]
Masahiro Kato, Kei Nakagawa, Kenshi Abe, Tetsuro Morimura.
Direct Expected Quadratic Utility Maximization for Mean-Variance Controlled Reinforcement Learning
NeurIPS 2021 Workshop on Deep Reinforcement Learning. [paper]
Kenshi Abe, Yusuke Kaneko.
Off-Policy Exploitability-Evaluation in Two-Player Zero-Sum Markov Games
AAMAS 2021 (Full Paper). [paper]
Gota Morishita^*, Kenshi Abe^*, Kazuhisa Ogawa, Yusuke Kaneko (^*equal contribution).
Online Learning for Bidding Agent in First Price Auction
AAAI 2020 Workshop on Reinforcement Learning in Games. [paper]

Preprints

Yuu Jinnai, Tetsuro Morimura, Ukyo Honda, Kaito Ariu, Kenshi Abe.
Model-Based Minimum Bayes Risk Decoding
[Arxiv]
Sho Shimoyama, Tetsuro Morimura, Kenshi Abe, Toda Takamichi, Yuta Tomomatsu, Masakazu Sugiyama, Asahi Hentona, Yuuki Azuma, Hirotaka Ninomiya.
Why Guided Dialog Policy Learning performs well? Understanding the role of adversarial learning and its alternative
[Arxiv]
Kenshi Abe, Kaito Ariu, Mitsuki Sakamoto, Atsushi Iwasaki.
A Slingshot Approach to Learning in Monotone Games
[Arxiv]
Tetsuro Morimura, Kazuhiro Ota, Kenshi Abe, Peinan Zhang.
Policy Gradient Algorithms with Monte-Carlo Tree Search for Non-Markov Decision Processes
[Arxiv]
Masahiro Kato, Kenshi Abe, Kaito Ariu, Shota Yasui.
A Practical Guide of Off-Policy Evaluation for Bandit Problems
[Arxiv]
Masahiro Nomura, Kenshi Abe.
A Simple Heuristic for Bayesian Optimization with A Low Budget
[Arxiv]

Internal Conference

阿部拳之, 蟻生開人, 坂本充生, 豊島健太郎, 岩崎敦.
Last-Iterate Convergence with Full- and Noisy-Information Feedback in Two-Player Zero-Sum Games.
第24回情報論的学習理論ワークショップ (IBIS2022).
蟻生開人, 阿部拳之, Alexandre Proutiere.
Thresholded Lasso Bandit.
第24回情報論的学習理論ワークショップ (IBIS2022).
富樫陸, 阿部拳之.
公平性を考慮した大規模推薦システム.
第24回情報論的学習理論ワークショップ (IBIS2022).
森村哲郎, 大田和寛, 阿部拳之, 張培楠.
ビームサーチ推論のための強化学習.
第24回情報論的学習理論ワークショップ (IBIS2022).
豊島健太郎, 坂本充生, 阿部拳之, 岩崎敦.
二人零和ゲームにおける突然変異駆動型Follow-The-Regularized-Leaderの終極反復収束.
第21回情報科学技術フォーラム (FIT 2022).
坂本充生, 豊島健太郎, 阿部拳之, 岩崎敦.
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究.
第36回人工知能学会全国大会 (JSAI2022). [paper]
坂本充生, 阿部拳之, 岩崎敦.
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究.
情報処理学会第84回全国大会.
豊島健太郎, 坂本充生, 阿部拳之, 岩崎敦.
クールノー競争におけるマルチエージェント強化学習に関する研究.
情報処理学会第84回全国大会.
坂本充生, 阿部拳之, 岩崎敦.
見間違えのある繰り返しゲームのためのActor-Critic型強化学習.
日本オペレーションズ・リサーチ学会 2021年秋季研究発表会. [paper]
坂本充生, 阿部拳之, 岩崎敦.
見間違えのある繰り返しゲームのためのActor-Critic型強化学習.
第24回情報論的学習理論ワークショップ (IBIS2021).
島野雄貴, 阿部拳之, 岩崎敦, 大河原一憲.
反実仮想後悔最小化によるアメリカンフットボールにおけるオフェンス戦略の均衡推定.
第20回情報科学技術フォーラム (FIT 2021).
坂本充生, 阿部拳之, 岩崎敦.
見間違えのある繰り返し囚人のジレンマにおける方策勾配法に関する研究.
第20回情報科学技術フォーラム (FIT 2021) (FIT船井ベストペーパー賞). [paper]
阿部拳之, 金子雄祐.
二人零和マルコフゲームにおけるオフ方策評価のためのQ学習.
第25回ゲームプログラミングワークショップ (GPW 2020). [paper]
阿部拳之.
広告配信オークションにおける入札戦略.
第19回情報科学技術フォーラム (FIT 2020).
阿部拳之.
多人数不完全情報ゲームにおけるAI開発.
日本経済学会 2020年度春季大会.
阿部拳之.
花札におけるナッシュ均衡戦略の計算.
第22回情報論的学習理論ワークショップ (IBIS2019).
野村将寛, 阿部拳之.
Black-box最適化に対するBudgetを考慮した探索空間の初期化.
第33回人工知能学会全国大会 (JSAI 2019). [paper]
阿部拳之, 野村将寛.
非定常多腕バンディットアルゴリズムを用いたハイパーパラメータ最適化フレームワークの提案.
第21回情報論的学習理論ワークショップ (IBIS2018).
阿部拳之, 小野功.
活用と探索の釣り合いを考慮した事例ベース政策最適化.
第12回進化計算学会研究会 (2017年). (ベストポスター発表賞)
阿部拳之, 小野功.
多峰性景観下での自然進化戦略による事例ベース政策最適化.
計測自動制御学会システム・情報部門学術講演会 (SSI2016).
阿部拳之, 小野功.
自然進化戦略を用いた事例ベース政策最適化.
第54回システム工学部会研究会 (2016年).

Research

International Conference

Preprints

Internal Conference

Presentations

Blog Posts