Основные понятия
オンライン健康コミュニティにおける新興意見マイニングのための大規模言語モデルを使用した枠組みを開発する。
Аннотация
この論文では、オンライン健康コミュニティにおける新興意見マイニングに焦点を当て、Redditから収集されたタイトルとコメントペアを使用して立場検出問題を定式化しています。また、LC-Stanceと呼ばれる新しいテストデータセットをリリースし、GPT-4がゼロショット立場検出で以前の研究を大幅に上回ることを示しています。さらに、LLMモデル診断を行い、クレームタイプ(暗黙的対明示的クレーム)やコメント長さがモデルエラーの原因であることを特定しています。
Статистика
LC-Stanceは150 Reddit投稿タイトルと400人間が注釈付けした(タイトル、コメント)ペアから成り立っている。
タイトル単語数の平均は14.14であり、コメント単語数の平均は48.34です。
ラベル分布は188件がFavor、109件がAgainst、103件がNoneです。
Цитаты
"Long Covid is an emerging post-COVID disorder with uncertain and complex treatment guidelines."
"Large Language Models (LLMs) have great potential to benefit social opinion mining research."
"Our goal is to develop an opinion mining framework that is scalable and useful in a real-world setting."