Core Concepts
一般化された言語モデルの台頭に伴い、アスペクトベースの感情分析の評価手法を再検討する必要がある。従来の抽出と分類の手法では不十分であり、生成モデルの出力を適切に評価する新たな手法が求められている。
Abstract
本論文では、アスペクトベースの感情分析(ABSA)における評価手法について議論している。従来のABSAは、アスペクト用語の抽出と、アスペクト、意見用語、感情極性の分類の2段階で行われてきた。しかし、近年の一般化された言語モデル(GLM)の台頭により、これらの要素を同時に生成する手法が登場している。
この生成型パラダイムの下では、従来の厳密一致評価では不十分であり、部分一致評価などの柔軟な評価手法が必要となる。また、要素ごとの評価と全体評価のバランスを取ることも重要である。さらに、自然言語生成(NLG)の評価手法をABSAに適用することも検討すべきである。
最後に、具体的な事例を挙げながら、これらの評価手法の長所短所を比較し、一般化された言語モデルを用いたABSAの評価に向けた提案を行っている。本論文は、この分野の研究者に対して有益な洞察を提供するものである。
Stats
入力文"key presses are too stiff to press ."に対して、正解クアドルプル(aspect, category, opinion, sentiment)は(key, Keyboard usability, stiff, Negative)である。
モデルの出力クアドルプルは(key, Keyboard usability, too stiff, Negative)と(key presses, Keyboard usability, stiff, Negative)の2つである。