訓練資料中的錯誤,例如標籤雜訊、類別不平衡、資料過時和預處理錯誤,會對深度學習模型的訓練行為產生重大影響,導致模型效能降低、不穩定和不可靠。
Newclid 是一個基於 AlphaGeometry 的全新符號幾何求解器,它透過模組化程式碼庫、新的除錯和視覺化工具以及 GeoGebra 整合,顯著提高了使用者友好性和推理能力。
大型語言模型驅動的程式碼輔助工具,如 GitHub Copilot,雖然提升了開發效率,但也帶來了顯著的能源消耗。 本文旨在探討影響這些工具能源消耗的關鍵因素,並提出優化配置以實現節能的行動見解。
大型語言模型 (LLM) 在驗證技術系統規格是否符合需求方面展現出潛力,尤其是在使用少量樣本提示的情況下,其準確性可與傳統基於規則的系統相媲美。
本文提出了一種名為 MPDetector 的自動化工具,用於偵測 Python 資料科學函式庫中程式碼與文件之間關於多參數約束的不一致問題。
雖然基於深度學習的代碼審查工具,如ChatGPT Plus,可以識別出大多數被審查者認為有效的程式碼問題,但它們並不能提高發現高嚴重性問題的可能性,也不能節省審查時間,而且可能會讓審查者產生偏見,只關注自動化審查工具所標記的程式碼部分。
隨著生成式人工智慧(GenAI)工具的迅速普及,電腦科學教育需要了解學生如何使用這些工具,以及如何調整教學策略,以培養學生負責任地使用 GenAI 並為未來職場做好準備。
軟體開發者對使用生成式 AI 工具進行程式碼編寫所帶來的授權和版權問題存在廣泛的看法,許多開發者意識到這些複雜法律問題的細微差別和複雜性。
大型語言模型(LLM)的快速發展為開發人員帶來了獨特的挑戰,本研究分析了 Stack Overflow 和 OpenAI 開發者論壇上的貼文,揭示了開發人員在使用和實作 LLM 時遇到的常見困難和問題。
本文提出了一種名為「蹺蹺板」生成機制的創新方法,用於動態和遞迴程式碼生成,解決了大型語言模型在生成大型程式碼專案時面臨的挑戰,例如權杖限制、依賴管理和迭代優化需求。