本論文は、検索支援型ニューラル機械翻訳アーキテクチャにおける検索手法の違いが翻訳性能に及ぼす影響を体系的に分析したものである。
主な知見は以下の通り:
自己回帰型の機械翻訳アーキテクチャは検索手法の変化に対してロバストであるが、編集ベースおよび大規模言語モデルベースのアーキテクチャでは、検索手法の最適化が重要である。
検索結果の網羅性を重視する δ-LCS 手法は、特に編集ベースのアーキテクチャで良好な性能を示す。
ドメイン内の検索を行うことが重要で、ドメイン外の検索は性能を大幅に低下させる。
検索フィルタリングを省略することで、計算コストを下げつつ、一部のアーキテクチャでは性能を向上させることができる。
検索結果の数を増やすことで、概して翻訳性能が向上するが、アーキテクチャによって最適な検索結果数は異なる。
検索結果の多様性を高めるための対照的な順位付けは、低スコアの検索結果に対して有効だが、高スコアの検索結果に対しては必ずしも有効ではない。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Maxime Bouth... klo arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02835.pdfSyvällisempiä Kysymyksiä