Core Concepts
統一された情報抽出と大規模言語モデルは、定義バイアスを解決できない。
Abstract
定義バイアスは情報抽出タスクにおいて重要な問題であり、異なるデータセット間や指示チューニングデータセットとの間に存在することが明らかになっています。
定義バイアスを軽減するための多段階フレームワークが提案されており、その効果が実証されています。
複数の実験を通じて、既存の手法では定義バイアスを解決できないことが示されています。
バイアス認識ファインチューニングとタスク固有のバイアス緩和から成るフレームワークは、定義バイアスを軽減するために効果的です。
定義バイアスの存在確認実験
NERおよびREタスクにおける完全監督設定で検証された結果は、異なるデータセット間で明らかな定義バイアスが存在していることを示しています。
UIEが定義バイアスに対処できるか?
Source Prompt Tuning実験では、UIEモデルが異なるソース名に基づいて一貫性のある結果を生成できないことが示されました。
LLMsが定義バイアスに対処できるか?
Zero-shotおよびFew-shot設定で行われた実験結果から、LLMsはコンテキスト学習を活用して部分的に定義バイアスを緩和できることが示されました。
定義バイアス軽減フレームワークの効果検証
提案された2段階ファインチューニングフレームワークは、他の手法よりも優れたパフォーマンスを達成しました。特に特定データセットでは最高水準のパフォーマンスを発揮しました。
Stats
Definition bias is a negative phenomenon that can mislead models.
Bias among IE datasets and Bias between IE and instruction tuning datasets are identified.
Fleiss’ Kappa is used to measure dataset definition bias and type definition bias.
Quotes
"Definition bias in IE refers to the tendency of an information extraction system to favor certain interpretations of data over others."
"Performance remains subpar in handling information extraction tasks, which we believe is due to definition bias."