NAACL 2025Regularized Best-of-N Sampling with Minimum Bayes Risk Objective for Language Model AlignmentYuu Jinnai, Tetsuro Morimura, Kaito Ariu, Kenshi Abeテーマ:LLM AlignmentarXiv
言語処理学会 第31回年次大会 (NLP 2025)大規模言語モデルのためのアライメントデータ合成手法の実験的評価坂本 充生, 陣内 佑, 森村 哲郎, 阿部 拳之, 蟻生 開人テーマ:LLM AlignmentPaper
Transactions on Machine Learning ResearchEvaluation of Best-of-N Sampling Strategies for Language Model AlignmentYuki Ichihara, Yuu Jinnai, Tetsuro Morimura, Kaito Ariu, Kenshi Abe, Mitsuki Sakamoto, Eiji Uchibeテーマ:LLM AlignmentarXiv