Core Concepts
大規模言語モデル(LLM)の機能を活用し、効率的に社会メディアメッセージの潜在的な議論を抽出する。
Abstract
本研究では、大規模言語モデル(LLM)の機能を活用した反復的なLLMsインザループ戦略を提案し、社会メディアメッセージの潜在的な議論を明らかにする。
まず、テーマごとにテキストインスタンスをクラスタリングする。次に、各サブクラスタの要約を生成し、LLMsを使ってサブクラスタ内の議論ポイントを抽出する。重複する議論ポイントは類似度に基づいて統合し、LLMsを使って共通の議論ポイントを生成する。最後に、インスタンスと議論ポイントの対応付けを行う。
この手法を気候キャンペーンとCOVID-19ワクチンキャンペーンの2つのケーススタディに適用した。結果、多くのメッセージをカバーする議論ポイントを発見でき、人手による判断と比較しても高い精度で対応付けができることが示された。さらに、イベントの発生に伴う議論ポイントの変化や、人口統計に応じた議論ポイントの違いについても分析を行った。
Stats
"気候変動の健康影響に取り組むための情報提供と公平性重視の取り組み"
"コミュニティの関与と緊急の政策措置を強調しながら、気候変動に立ち向かう集団行動と教育"
"石炭から再生可能エネルギーへの移行により、気候変動に対処し、持続可能性を促進する"
"再生可能エネルギーへの移行を加速させ、気候変動に対処し、雇用創出を通じた経済成長を支援する"
"気候変動の影響から鳥を守るための気候・クリーンエネルギーソリューションへの継続的な投資"
"極端な気象イベントに対するレジリエンスを高め、持続可能な未来を確保するための気候変動に関する緊急の立法措置"