Core Concepts
要求工学分野における自然言語処理研究の再現性を高めるための取り組み
Abstract
本論文は、要求工学分野における自然言語処理研究の再現性を高めるための取り組みについて述べている。
まず、著者らは2つの既存の自然言語処理ツールの再構築を行った。1つは要求文中の照応曖昧性の検出に関するツール、もう1つは機能要件と非機能要件の分類に関するツールである。この再構築の経験から、データアノテーションとツールの再構築に関する様々な課題を抽出した。
データアノテーションに関する課題には以下のようなものがある:
要求工学特有の分類タスクには明確な理論的基盤が欠けている
アノテーターの専門知識不足が正確なアノテーションを阻害する
アノテーション作業は時間がかかり、アノテーターの疲労が品質に影響する
アノテーションプロトコルの変更によりデータの再アノテーションが必要になる
アノテーター育成のための教材や機会が不足している
ベンチマークデータセットが不足しており、先行研究との比較が困難
不均衡なデータセットが存在し、マイノリティクラスの理解が難しい
アノテーションに必要な文脈情報の適切な量を決めるのが難しい
アノテーターの動機付けが困難で、社会的な側面の管理が課題
ツールの再構築に関する課題には以下のようなものがある:
元論文の実装の詳細が曖昧、不正確、不完全である
元ツールの開発や評価に非公開データが使われていると、正確な再現が困難
元論文の著者とのコミュニケーションが役立たない場合がある
自然言語処理のエコシステムの進化により、使用ライブラリが古くなったり利用できなくなる
ツールは試作品として開発されることが多く、長期的なメンテナンスがされない
ツールの再現は研究貢献として評価されにくく、研究者の動機付けが低い
これらの課題に対処するため、著者らはID-Cardと呼ばれる新しい成果物を提案している。ID-Cardは再現性に関連する情報を構造化して要約するものであり、論文の補足資料として活用できる。
Stats
要求文中の照応表現の曖昧性を検出するタスクでは、200件の要求文を2人のアノテーターが分析し、103件の曖昧な要求文を特定した。
機能要件と非機能要件の分類タスクでは、1,500件以上の要求文を2人のアノテーターが分析し、Li et al.のタクソノミーに基づいて分類した。
Quotes
"要求工学特有の分類タスクには明確な理論的基盤が欠けている"
"アノテーターの専門知識不足が正確なアノテーションを阻害する"
"ツールの再現は研究貢献として評価されにくく、研究者の動機付けが低い"