第39回人工知能学会全国大会 (JSAI 2025)日本語大規模言語モデルの自己学習によるアライメントの実験評価坂本 充生, 陣内 佑, 森村 哲郎, 阿部 拳之, 蟻生 開人テーマ:LLM AlignmentPaper
NAACL 2025Regularized Best-of-N Sampling with Minimum Bayes Risk Objective for Language Model AlignmentYuu Jinnai, Tetsuro Morimura, Kaito Ariu, Kenshi Abeテーマ:LLM AlignmentarXiv
Transactions on Machine Learning ResearchEvaluation of Best-of-N Sampling Strategies for Language Model AlignmentYuki Ichihara, Yuu Jinnai, Tetsuro Morimura, Kaito Ariu, Kenshi Abe, Mitsuki Sakamoto, Eiji Uchibeテーマ:LLM AlignmentarXiv