核心概念
VISUALCODER 透過整合多模態思維鏈推理和視覺化控制流程圖 (CFG),提升大型語言模型對程式碼執行的理解和推理能力,進而在程式碼行為預測、錯誤檢測和輸出生成等方面取得顯著的效能提升。
摘要
VISUALCODER:透過細粒度多模態思維鏈推理,引導大型語言模型進行程式碼執行
這篇研究論文旨在探討如何提升大型語言模型 (LLM) 在程式碼執行方面的推理能力,特別是在處理動態程式行為(如預測執行軌跡、變數值或執行時錯誤)的挑戰。
研究提出名為 VISUALCODER 的方法,其核心概念是將多模態思維鏈 (CoT) 推理與視覺化控制流程圖 (CFG) 結合。具體來說,VISUALCODER 透過以下機制運作:
參考機制: 將程式碼片段與其對應的 CFG 元素明確連結,引導模型在推理過程中關注程式碼與其執行流程之間的特定關聯。
視覺化 CFG: 利用視覺化 CFG 圖像,而非僅僅依靠文字描述,讓模型更直觀地理解程式碼的非線性執行流程,例如迴圈和分支。