Core Concepts
データ拡張手法を適用することで、自然言語テキストからのビジネスプロセス情報抽出の精度を向上させることができる。
Abstract
本論文では、自然言語テキストからビジネスプロセス関連情報を抽出する際に、データ拡張手法の適用効果を検討している。
まず、自然言語処理分野で提案されているデータ拡張手法の中から、ビジネスプロセス情報抽出に適用可能な19の手法を選定した。これらの手法は以下の3つの特性を持つ:
言語の多様性を高める: 同じプロセスを異なる表現で記述する
抽出対象の長さを変化させる: 短い表現を長い表現に置き換える
抽出対象間の関係の向きを変化させる: 述語と項目の順序を入れ替える
次に、これらの手法を PET データセットに適用し、メンション抽出(MD)とリレーション抽出(RE)の精度を評価した。その結果、以下のことが分かった:
単純な手法(単語の入れ替え、削除、挿入など)でも、特にREタスクの精度を2.9~4.5ポイント向上できる
大規模言語モデルを使った高度な手法は、計算コストが高く、精度向上効果は小さい
以上より、データ拡張は自然言語テキストからのビジネスプロセス情報抽出に有効な手法であり、特に単純な手法の活用が重要であることが示された。
Stats
After a claim is registered, it is examined.
クレームが登録された後、それが審査される。
クレームが登録された後、それが検査される。
この書類は請求処理担当者に渡され、初期の請求見積もりが計算される。
この書類は請求管理者に渡され、損害の初期見積もりが計算される。
この書類は請求担当者に渡され、クレームが計算される。