HLTCOEチームは、TREC 2023 NeuCLIRトラックに参加し、以下の取り組みを行った:
PLAID: ColBERTアーキテクチャを使った密な検索モデル。Translate-Train、Translate-Distillの手法を適用し、クロスリンガル検索を実現した。また、マルチリンガルTranslate-Trainモデルを開発し、単一のモデルで全言語ペアに対応できるようにした。
mT5リランカー: 強力なmT5モデルを使ったリランキング手法。PLAIDモデルの出力をさらに精度向上させた。
疎な検索手法:
実験の結果、mT5リランカーが最も高い精度を示した。また、Translate-DistillモデルはmT5リランカーに匹敵する性能を発揮しつつ、効率的であることが分かった。一方で、日付情報を活用したPLAIDモデルの精度は低下した。マルチリンガル検索では、MTTモデルが最も良い結果を示した。技術文書タスクでは、モノリンガルのPLAIDモデルとmT5リランカーが優れた性能を発揮した。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Eugene Yang,... kl. arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08118.pdfDybere Forespørgsler