本研究では、ブラジルの連邦司法制度における特別上訴文書と反復テーマ文書の2つのコーパスを収集しました。特別上訴文書は平均4,672単語で構成されており、反復テーマ文書は平均43単語で構成されています。
提案手法GLAREは以下の2つのステップから成ります:
実験の結果、GLAREは既存のElasticsearchベースラインよりも優れた性能を示しました。また、教師あり学習モデルと比較しても、特に訓練データに代表されていないテーマに対して高い精度を達成しました。これは、教師なし学習アプローチであるGLAREが、事前に分類されていない特別上訴を適切なテーマに分類できることを示しています。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Tiefere Fragen