Core Concepts
専門モデルと長文処理が法的判断予測の性能向上に重要であることを示す。
Abstract
近年、自然言語処理(NLP)全体が驚異的な新しい結果を楽しんでおり、特に法的NLP領域も成長しています。しかし、一般的なモデルは法的領域に直接適用することが難しいため、専門モデルや方法が必要です。この研究では、ルーマニア語の4つのLJPデータセットに対する実験を通じて、専門モデルと長文処理が良好なパフォーマンスに不可欠であることを示しています。特に、SLEDエンコーディングは、ロングドキュメントの法的判断予測タスクで基準方法と比較して性能を大幅に向上させることが重要です。
Stats
ルーマニアの銀行ケース:14367件(ADM)、15044件(ENF)
BRDグループソシエテジェネラル提供BRDCases:236件(ADM)、90件(ENF)
jurBERT: 512トークン - 平均AUC 78.20%
SLED: 32*256 - 平均AUC 67.57%
Llama2: 1024トークン - 平均AUC 69.88%
Quotes
"専門モデルと長文処理は良好なパフォーマンスに不可欠である"
"ロングドキュメントのエンコードは性能向上に重要"
"LLMは低リソース言語では特化された解決策よりも劣っている"