本研究は、Transformer ベースの自然言語推論エンコーダーが、本来の課題関連の特徴よりもデータセットのバイアスに過度に依存する問題に取り組む。従来の除バイアス手法は、どのサンプルがバイアスかを学習させるが、個々のサンプル内のどの部分がバイアスかを特定することができない。これにより、分布外推論の能力が制限される。
本研究では、人間の説明に着目し、キーワードとバイアスを識別し、バイアスを分離する説明ベースのバイアス分離正則化(EBD-Reg)を提案する。EBD-Regは、識別、分離、整合の3つの並列監督目標を設定し、モデルがキーワードに注目しつつバイアスを排除することを目指す。
実験の結果、EBD-Regは様々なTransformer ベースのエンコーダーに容易に統合でき、他の除バイアス手法を大きく上回る分布外推論性能を示した。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jianxiang Za... at arxiv.org 04-23-2024
https://arxiv.org/pdf/2404.13390.pdfDeeper Inquiries