本文探討了大型語言模型是否能有效利用語法書的語法解釋和平行句子來進行低資源語言的機器翻譯。研究結果顯示:
大型語言模型主要依賴於語法書中的平行句子,而無法有效利用語法解釋來提升翻譯效果。無論是對於未見過的卡拉芒語(kgv)還是低資源的尼泊爾語(npi),移除平行句子會導致翻譯質量大幅下降,而移除語法解釋則影響較小。
微調小型機器翻譯模型在相同的平行數據上可以達到與大型語言模型類似的效果,甚至在某些情況下優於大型語言模型。這表明平行句子是最關鍵的信號來源,而不需要依賴於語法書的冗長上下文。
作者提出了一種利用語言的類型學特徵的提示方法,發現在語法判斷和詞彙預測等語言學任務上,這種方法優於單純使用語法書,表明大型語言模型可以利用適當形式的語法知識來完成相關任務。
總之,本文強調了針對不同任務選擇合適的數據非常重要:對於機器翻譯,平行句子是最關鍵的;而對於語言學任務,類型學特徵等語法知識更有幫助。作者建議,在收集低資源多語言數據時,應該更多地關注平行數據,而非語法描述。
翻譯成其他語言
從原文內容
arxiv.org
深入探究