快科技6月17日消息,月之暗面推出了針對軟件工程任務(wù)的全新開源代碼大模型——Kimi-Dev-72B。
該模型在SWE-bench Verified編程基準(zhǔn)測試中取得了全球高開源模型水平,以僅72B的參數(shù)量,超越了剛發(fā)布不就、參數(shù)量達(dá)671B的新版DeepSeek-R1。
該模型通過大規(guī)模強(qiáng)化學(xué)習(xí)進(jìn)行優(yōu)化,能夠自主修補(bǔ)Docker中的真實存儲庫,并且只有當(dāng)整個測試套件通過時才會獲得獎勵,從而確保了解決方案的正確性和穩(wěn)健性。
Kimi-Dev-72B的設(shè)計理念和技術(shù)細(xì)節(jié)包括BugFixer和TestWriter的組合、中期訓(xùn)練、強(qiáng)化學(xué)習(xí)和測試時自我博弈。
其中,BugFixer和TestWriter的互補(bǔ)設(shè)計奠定了模型的基礎(chǔ),使其在修復(fù)錯誤和編寫測試方面表現(xiàn)出色。
中期訓(xùn)練則通過約1500億個高質(zhì)量的真實數(shù)據(jù),增強(qiáng)了模型對實際Bug修復(fù)和單元測試的理解。
強(qiáng)化學(xué)習(xí)階段則專注于提升其代碼編輯能力,使其在文件本地化和代碼編輯方面表現(xiàn)出色。
目前,Kimi-Dev-72B已在Hugging Face和GitHub上提供下載和部署,包括模型權(quán)重、源代碼等。
本文鏈接:http://www.www897cc.com/showinfo-17-160508-0.html月之暗面放王炸!開源Kimi新模型:超新版DeepSeek R1全球第一
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com