本研究では、5つの最新のコリファレンス解決モデルを再実装し、言語モデルの選択や学習エポック数などの要因を統制して比較評価を行った。その結果、以下の知見が得られた:
言語モデルの選択を統制すると、より新しいモデルが必ずしも高精度ではなく、最も古いモデルの1つであるC2Fが、ドメイン外のジャンルでも良好な汎化性能を示した。
エンコーダベースのモデルは、同程度の言語モデルサイズのデコーダベースのモデルと比べて、精度、推論速度、メモリ使用量の全ての指標で優れていた。
最大1.5Bパラメータまでエンコーダベースモデルを拡張しても、デコーダベースモデルよりも高精度を維持できることが示された。
つまり、言語モデルの選択を統制することで、近年報告されてきた精度向上の多くが説明できることが明らかになった。今後の提案手法の評価においては、このような要因を慎重に検討する必要があると結論付けている。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Ian Porada,X... at arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00727.pdfDeeper Inquiries