Core Concepts
自然言語処理モデルの予測を正当化するための説明を評価するための形式的な枠組みを提案する。自由形式、演繹的、議論的の3つの説明形式を定義し、それぞれの説明に適した特性を定義する。また、これらの特性に基づいた評価メトリクスを提案する。
Abstract
本論文は、自然言語処理モデルの予測を正当化するための説明を評価するための形式的な枠組みを提案している。
まず、説明の形式として以下の3つを定義している:
自由形式の説明: 命題の順序付きリスト
演繹的な説明: 命題の順序付きリストと命題間の関係
議論的な説明: 引数の集合、支持関係、攻撃関係
次に、それぞれの説明形式に適した特性を定義している:
自由形式の説明: 一貫性
演繹的な説明: 非循環性、(弱い/強い)関連性、非冗長性
議論的な説明: 弁証法的非循環性、受け入れ可能性
最後に、これらの特性に基づいた評価メトリクスを提案している。自由形式の説明では一貫性スコア、演繹的な説明では関連性スコアと冗長性スコア、議論的な説明では受け入れ可能性スコアと循環性スコアを定義している。
この枠組みは、自然言語処理タスクにおける説明の評価に活用できると考えられる。また、説明の構造に応じて適切な特性と評価メトリクスを選択できるため、柔軟性が高い。
Stats
p1: 米国には王はいない。米国は共和制国家である。
p2: 白宮は米国大統領の公式の居住地である。
p3: 米国の元首はアメリカ大統領である。大統領という肩書は通常共和制国家の元首に付けられる。
Quotes
a1: 米国には王がいないため、米国の王は白宮に住むことはできない。
a2: 白宮は米国大統領の公式の居住地であるため、王やその他の元首の居住地にはなり得ない。
a3: 米国の元首はアメリカ大統領であり、大統領という肩書は通常共和制国家の元首に付けられる。