核心概念
大規模言語モデル(LLM)は、小説のキャラクターを理解し、詳細なキャラクタープロファイルを生成することができる。
要約
本研究では、LLMのキャラクター理解能力を評価するため、キャラクタープロファイリングタスクを提案している。具体的には以下の通り:
属性、関係性、出来事、性格の4つの側面からキャラクタープロファイルを定義し、LLMによる生成を評価する。
文献専門家が作成したCROSS(Character Profiles from SuperSummary)データセットを構築し、LLMの生成プロファイルと比較する。
生成されたプロファイルの一貫性を評価する内部評価と、キャラクターの動機を認識する外部評価を行う。
階層的マージング、増分更新、一括要約の3つの要約手法を比較し、GPT-4が最も優れた性能を示すことを明らかにした。
各プロファイル側面の重要性を分析し、出来事の情報が動機認識タスクに最も大きな影響を与えることを示した。
本研究は、LLMのキャラクター理解能力を包括的に評価し、RPAシステムの構築に活用できる知見を提供している。
統計
LLMは小説キャラクターの属性、関係性、出来事、性格を概ね正確に要約できる。
GPT-4は他のLLMよりも高い一貫性スコアと動機認識精度を示した。
出来事に関する情報が動機認識タスクに最も大きな影響を与える。
引用
"LLMは小説のキャラクターを理解し、詳細なキャラクタープロファイルを生成することができる。"
"本研究は、LLMのキャラクター理解能力を包括的に評価し、RPAシステムの構築に活用できる知見を提供している。"