本研究では、ブラジルの連邦司法制度における特別上訴文書と反復テーマ文書の2つのコーパスを収集しました。特別上訴文書は平均4,672単語で構成されており、反復テーマ文書は平均43単語で構成されています。
提案手法GLAREは以下の2つのステップから成ります:
実験の結果、GLAREは既存のElasticsearchベースラインよりも優れた性能を示しました。また、教師あり学習モデルと比較しても、特に訓練データに代表されていないテーマに対して高い精度を達成しました。これは、教師なし学習アプローチであるGLAREが、事前に分類されていない特別上訴を適切なテーマに分類できることを示しています。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Fabi... lúc arxiv.org 09-25-2024
https://arxiv.org/pdf/2409.15348.pdfYêu cầu sâu hơn