核心概念
大規模言語モデルを用いて、民事訴訟法の原則と法律を特定の事例に適用する能力を評価する。
要約
本論文では、SemEval 2024 Task 5: The Legal Argument Reasoning Task in Civil Procedureに取り組んだ取り組みを紹介する。
2つのアプローチを提案した:
ドメイン知識を持つBERT系モデルの微調整
GPTモデルによるフューショットプロンプティング
BERTモデルの場合、ドメイン知識を持つモデルの方が良い性能を示した。
GPTモデルの場合、回答妥当性検証タスクを多肢選択式QAタスクに置き換えると大幅に性能が向上した。
最良のモデルはBERT系で、20チーム中7位の成績を収めた。
データセットの特性(正解率の偏り)に合わせたルールベースのアルゴリズムを適用することで、さらに性能を向上させた。
今後の課題として、法律や判例を直接入力として与えることで、モデルの法的推論能力をより深化させることが考えられる。
統計
訓練データ666件、検証データ84件、テストデータ98件で構成される。
正解率の偏りが課題で、正解ラベル(1)の事例数が少ない。