核心概念
本研究では、欧州人権裁判所の判決文を活用し、先例検索のためのデータセットを構築した。事実と論理の明確な分離、先例引用の実践など、この裁判所の特徴を活かし、より包括的な先例理解を促進するデータセットを開発した。
要約
本研究では、欧州人権裁判所(ECtHR)の判決文を活用し、先例検索(Prior Case Retrieval, PCR)のためのデータセットを構築した。
まず、ECtHR判決文の構造を分析し、事実と論理の部分を明確に分離した。これにより、判決文の論理部分が未知の状態で事実のみを使ってPCRを行う、実践的な設定を実現した。
次に、ECtHR全判決文をデータセットに含め、時系列に沿って訓練、検証、テストデータに分割した。これにより、実際の法的実践に近い規模と動的な候補文書プールを実現した。
データセットの分析から以下の知見を得た:
約6,000件の判決文が引用されていない一方で、1,700件以上が1回以上引用されており、引用頻度が先例の影響力の指標となる
事実のみを使う場合よりも、論理部分を使う方が先例検索の精度が高く、Halsbury説(判断理由が先例性の根拠)が実践的により支持されている
本データセットを活用し、様々な先例検索モデルを検証した結果、以下の課題が明らかになった:
難易度ベースのネガティブサンプリング手法は先例検索タスクでは有効ではない
時間の経過とともに、特に深層学習モデルの性能が劣化する問題がある
先例の引用関係を明示的にモデル化することで、より効果的な先例検索が期待できる
これらの課題に取り組むことで、法的実践に資する先例検索システムの実現が期待される。
統計
判決文の引用頻度は、先例の影響力を示す指標となる。約6,000件の判決文が引用されておらず、一方で1,700件以上が1回以上引用されている。