Core Concepts
異なる談話アノテーションフレームワークで定義された談話関係の間の相関関係を自動的に学習する手法を提案する。
Abstract
本論文は、異なる談話アノテーションフレームワークで定義された談話関係の相関関係を自動的に学習する手法を提案している。
主な内容は以下の通り:
既存の談話コーパスは異なるフレームワークに基づいて注釈付けされており、議論単位の定義や関係の定義、構造的制約に大きな違いがある。これらの違いにより、異なるフレームワークの談話関係の対応関係を明らかにするのが困難となっている。
提案手法では、ラベル埋め込みを利用して、異なるフレームワークの談話関係の対応関係を自動的に学習する。これにより、議論単位の一致を必要とせずに、関係の対応関係を発見できる。
RST-DTとPDTB 3.0のデータを用いた実験では、提案手法が既存の手法よりも優れた性能を示した。特に、PDTB の明示的な関係については、高い精度で対応関係を発見できることが確認された。
提案手法は、談話理論の統合や、異なるフレームワークで注釈付けされた談話コーパスの相互運用性を実現する上で有用である。
Stats
談話関係の定義の違いにより、異なるフレームワークの談話関係の対応関係を明らかにするのが困難である。
既存の手法では、議論単位の一致が必要であり、専門知識と手作業による検証が必要となる。