主観的NLPタスクでは、人間の判断の変動性をうまくモデル化することが課題となる。一般的に、データセットに注釈をつけた上で機械学習モデルを訓練するが、この際に注釈の多数派の意見しか反映されず、少数派の視点が無視されてしまう問題がある。
本研究では、注釈者中心のアクティブラーニング(ACAL)を提案する。ACALは、従来のアクティブラーニング(AL)アプローチに注釈者選択戦略を組み合わせたものである。データサンプリング後に、どの注釈者にデータに注釈をつけてもらうかを決める。これにより、人間の判断の多様性をより効率的に近似することができる。
実験では、7つの主観的NLPタスクにおいてACAlを評価した。結果、ACAlはデータ効率性と注釈者中心の性能評価において優れていることが示された。ただし、ACAlの有効性は、十分に大きく多様な注釈者プールが利用可能であるかどうかに依存することが分かった。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Michiel van ... في arxiv.org 04-25-2024
https://arxiv.org/pdf/2404.15720.pdfاستفسارات أعمق