핵심 개념
Proposing Popularity-Aligned Language Models (PopALM) to predict trendy responses on social media by aligning language generation with popularity through reinforcement learning.
초록
ソーシャルメディアのトレンディな反応を予測するために、人気に合わせた言語モデル(PopALM)を提案します。PopALMは、ノイズのあるラベルから人気を学習するためにカリキュラム学習戦略を組み込んだプロキシマルポリシーオプティマイゼーションに統合されています。大規模なWeiboデータセットでの実験結果は、PopALMがさまざまなトレーニング設定において性能向上を示しています。
통계
30K daily-trending events from Weibo dataset
Top-3 trendy responses for each post
Average length of posts: 119.8 tokens, responses: 25.8 tokens
인용구
"Despite the breakthrough progress in automatic response generation thanks to the advances in large language models (LLMs), most previous work focuses on generic human responses without considering the popularity factors in the social contexts."
"Compared to generic responses, popular responses are much more closely linked to the events’ trajectory and better reflect the mainstream voices of the public."