軟件工程 3.0 (SE 3.0) 是一個以意圖為先、對話導向的開發模式,旨在通過人類開發者與人工智能隊友之間的協作,最大限度地發揮人類和人工智能的優勢,從而更有效率地構建更高質量的軟件。
Code-Survey 是一種利用大型語言模型(LLM)系統地探索和分析大規模代碼庫的創新方法論。它通過設計調查問卷,將非結構化的軟件開發數據(如提交記錄和郵件列表討論)轉換為有組織、結構化和可分析的數據集,從而實現對複雜軟件系統演化的定量分析。
本文提出了一種基於比特流特徵的HEVC軟件編碼能量估算模型,能夠準確估算編碼能量消耗。
本文提出了一種能夠在有限訓練數據和相對複雜的語言特徵的情況下有效運行的查詢重寫解決方案。
提出了一種基於查找表的可編程和可擴展的神經網路加速器框架(LUT-NA),通過預先計算的更快查找來降低傳統數字加速器的功耗和面積開銷,同時避免模擬電路的噪聲和失配問題。
現有的代碼生成模型可以幫助改善許多常見的軟件任務,從代碼完成到缺陷預測。然而,現有的基準測試主要集中在代碼創作或代碼完成,而很少關注軟件測試,儘管良好的測試軟件與有效的錯誤檢測之間存在強烈的相關性。為了填補這一空白,我們創建並發布了TESTGENEVAL,這是一個大規模的基準測試,用於測量測試生成性能。TESTGENEVAL包含來自11個維護良好的Python存儲庫的1,210個代碼和測試文件對,涵蓋了初始測試編寫、測試套件完成和代碼覆蓋率提高。我們評估了幾種流行的模型,參數大小從7B到405B不等。我們的詳細分析突出了TESTGENEVAL對全面評估測試生成性能的貢獻。特別是,模型難以生成高覆蓋率的測試套件,最佳模型GPT-4o只達到35.2%的平均覆蓋率。這主要是由於模型難以推理執行,以及在處理複雜代碼路徑時經常出現斷言錯誤。
本文提出了一種新的二進制搜索ADC設計,可以顯著減少面積開銷,並提出了一種訓練優化方法,進一步減少ADC的複雜度,同時保持分類精度。
本文提出了五種度量指標,以識別開源軟件項目中的浪費,包括閒置分支、項目多樣化指數、拉取請求拒絕率、積壓反轉指數和功能實現率。這些指標可以幫助團隊做出決策並提高最終產品的質量。
LiveArt推出了其獨家的大使計劃,為參與者提供了與頂級NFT收藏互動並獲得可觀回報的機會。
本文提出了一種方法,通過微調預訓練的嵌入式模型,以提高企業環境中信息檢索解決方案的性能。通過將嵌入式模型適應於企業特有的檢索任務,可以顯著提高搜索結果的精確度和相關性。