核心概念
大型語言模型 (LLM) 和多語言 LLM (MLLM) 可用於增強危機情境中的機器翻譯 (MT) 能力,特別是對於低資源語言,透過微調技術和社群驅動的語料庫開發策略,可以快速構建高品質的翻譯系統。
這篇研究論文探討了如何利用大型語言模型 (LLM) 和多語言 LLM (MLLM) 來增強危機情境中的機器翻譯 (MT) 能力,特別關注低資源語言。
研究目標:
探討如何利用 LLM 和 MLLM 來改善危機情境中低資源語言的機器翻譯。
評估 LLM 和 MLLM 在危機情境機器翻譯中的效能,特別是針對低資源語言。
方法:
採用社群驅動的方法,利用客製化的 GPT 模型快速建立危機相關的平行語料庫。
使用 adaptMLLM 等工具微調預先訓練的 MLLM 模型,例如 NLLB,以適應特定危機的語言需求。
使用標準的機器翻譯評估指標(如 BLEU、TER 和 ChrF)比較微調後的 MLLM 模型與其他系統(如客製化 GPT 和 OpenAI 微調模型)的效能。
主要發現:
與 LoResMT2021 共享任務中的基準系統相比,微調後的 MLLM 模型在英語-愛爾蘭語和英語-馬拉地語語言對的翻譯品質方面表現出顯著的提升。
客製化 GPT 模型可以快速部署,並在危機初期提供可接受的翻譯品質,而微調後的 MLLM 模型則需要較長的開發時間,但可以提供更高的準確度。
社群參與在創建高度專業化、針對特定危機的數據集方面發揮著至關重要的作用。
主要結論:
LLM 和 MLLM 有潛力徹底改變危機情境中的機器翻譯,特別是對於低資源語言。
透過微調技術和社群驅動的語料庫開發策略,可以快速構建高品質的翻譯系統。
未來的工作應側重於將這些方法擴展到其他低資源語言和危機情境。
意義:
這項研究對人道主義科技領域做出了貢獻,它提供了一個藍圖,說明如何在緊急情況下開發多語言溝通系統。它強調了社群參與和模型微調在克服低資源語言翻譯挑戰方面的重要性。
局限性和未來研究:
研究的重點是兩種語言對(英語-愛爾蘭語和英語-馬拉地語),需要對其他低資源語言進行進一步調查。
應進一步探討在危機情境中自動評估指標和人類評估之間的相關性。
未來的工作可以探索將 LLM 和 MLLM 整合到更廣泛的危機溝通系統中,例如跨語言資訊檢索和摘要系統。
統計資料
Microsoft 在 2010 年海地地震後,在 4 天 17 小時 30 分鐘內從零開始構建了海地克里奧爾語翻譯系統。
該系統在克里奧爾語到英語的翻譯中獲得了接近 30 的 BLEU 分數,在英語到克里奧爾語的翻譯中獲得了 18.3 的 BLEU 分數。
LoResMT2021 共享任務提供了 502 個愛爾蘭語和 500 個馬拉地語驗證語句,以及 250 個(愛爾蘭語到英語)、500 個(英語到愛爾蘭語)和 500 個(英語到馬拉地語)測試語句。
英語-馬拉地語語言對的訓練數據包含 20,933 行平行數據,而英語-愛爾蘭語模型的訓練數據則使用了 13,171 行平行數據。
所有 MLLM 模型都透過使用 adaptMLLM 應用程式微調一個具有 33 億個參數的 NLLB 預先訓練模型來進行訓練。
OpenAI 微調模型是使用 GPT-3.5-turbo-0125 作為預先訓練模型開發的。