本文介紹了ChemDFM,這是一個針對化學領域進行專門訓練的大型語言基礎模型。ChemDFM是從通用領域的LLaMa模型出發,通過兩個階段的訓練過程獲得化學領域的知識和能力:
領域預訓練階段:使用來自3.8M篇化學論文和1.4K本化學教科書的34B個詞彙,讓模型學習化學知識。
指令微調階段:使用2.7M個化學相關的指令和問題,讓模型熟悉化學語言和概念,尤其是分子表示法。
通過這兩個階段的訓練,ChemDFM獲得了在化學領域的理解和推理能力,在分子識別、分子設計、分子性質預測、反應預測等任務上顯著優於其他通用領域的語言模型,甚至在某些任務上超越了GPT-4。
ChemDFM還展現了在自然語言對話中與人類研究人員合作的潛力。在論文閱讀和實驗設計的場景中,ChemDFM能夠理解問題的化學含義,提供相關的見解和建議,展現出作為化學研究助手的能力。
總的來說,ChemDFM的出現標誌著大型語言模型在化學領域的重大突破,為未來實現化學人工通用智能奠定了基礎。
翻譯成其他語言
從原文內容
arxiv.org
深入探究