Grunnleggende konsepter
Language models can optimize user preferences efficiently through the OPEN framework.
Sammendrag
最近、言語モデル(LM)を使用して人間の好みに関する情報を収集することが増えています。過去の研究では、LMを促してユーザーの好みに関する質問をすることが可能であることが示されています。しかし、これらの方法は制御が限られており、しばしば有用または情報提供性の高い質問を生成できません。一方、最適実験設計などの不確実性を考慮したアプローチは、限られた相互作用からユーザーの好みを効率的に推論する方法を開発してきました。本研究では、OPEN(Optimal Preference Elicitation with Natural language)フレームワークを導入し、LMとBayesian Optimal Experiment Design(BOED)メソッドの利点を組み合わせています。OPENはユーザー研究で既存のLMおよびBOEDベースの好み引き出し手法よりも優れたパフォーマンスを示すことが明らかになりました。
Statistikk
著者:Kunal Handa, Yarin Gal, Ellie Pavlick, Noah Goodman, Jacob Andreas, Alex Tamkin, Belinda Z. Li
メール:kunal.handa@cs.ox.ac.uk, yarin@cs.ox.ac.uk, ellie_pavlick@brown.edu, ngoodman@stanford.edu, jda@mit.edu, atamkin@anthropic.com, bzl@mit.edu
抽象:AIシステムをユーザーの興味に合わせるためには、人間の複雑な価値観や好みを理解し取り込む必要があります。言語モデル(LM)とBayesian Optimal Experimental Design(BOED)メソッドを組み合わせたOPENフレームワークは、他のLMおよびBOED手法よりも優れたパフォーマンスを示します。
主題:言語モデルによる好み引き出し
Sitater
"Aligning AI systems to users’ interests requires understanding and incorporating humans’ complex values and preferences."
"In user studies, we find that OPEN outperforms existing LM- and BOED-based methods for preference elicitation."