Основные понятия
大型語言模型 (LLM) 在程式碼生成方面取得了顯著的成果,但由於訓練資料中低頻率詞彙的代表性不足,LLM 經常會誤解或忽略程式碼生成過程中特定問題中出現的低頻率關鍵詞,從而影響生成程式碼的準確性。
Аннотация
自解釋關鍵詞:賦能大型語言模型進行程式碼生成的新方法
Fan, L., Chen, M., & Liu, Z. (2024). Self-Explained Keywords Empower Large Language Models for Code Generation. arXiv preprint arXiv:2410.15966.
本研究旨在解決大型語言模型 (LLM) 在程式碼生成過程中,由於訓練資料長尾分佈問題導致低頻詞彙理解不足,進而影響生成程式碼準確性的問題。