Khái niệm cốt lõi
ユーザーの編集履歴から潜在的な好みを推論し、それを使ってレスポンスを生成することで、ユーザーの編集コストを最小化する。
Tóm tắt
本論文では、ユーザーの編集履歴からユーザーの潜在的な好みを学習し、それを使ってレスポンスを生成することで、ユーザーの編集コストを最小化する手法を提案している。
具体的には以下の通り:
ユーザーがLLMエージェントに対してコンテキストを与え、エージェントが応答を生成する。ユーザーはその応答を編集する。
エージェントはユーザーの編集履歴から、ユーザーの潜在的な好みを推論する。
推論した好みを使ってレスポンスを生成することで、ユーザーの編集コストを最小化する。
提案手法のCIPHERでは、過去の編集履歴から最も近いコンテキストを検索し、それらの好みを統合して現在のコンテキストの好みを推定する。これにより、好みの学習と応答生成のコストを低減できる。
実験では、要約タスクとメール作成タスクを用いて評価を行い、提案手法が既存手法に比べて編集コストを大幅に削減できることを示している。また、学習した好みが実際の好みに近いことも確認している。
Thống kê
ユーザーの編集コストは、提案手法CIPHER-1-MPNETが最も低かった。
提案手法のCIPHERは、既存手法に比べて好みの推定精度が高かった。
提案手法のCIPHERは、LLMへのクエリコストが既存手法に比べて低かった。