當(dāng)前位置：首頁 > 元宇宙 > AI

LeCun 團(tuán)隊(duì)開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

來源：責(zé)編：時(shí)間：2025-09-26 17:37:53 80觀看

導(dǎo)讀瘋狂挖人的 Meta，終于在今天發(fā)布了最新 AI 研發(fā)成果！代碼世界模型 CWM 是本次發(fā)布的模型，創(chuàng)新性地將世界模型引入了代碼生成任務(wù)中。這是否會(huì)成為編程模型新范式？瘋狂挖人的 Meta，終于把他們的 AI 研發(fā)新成果端上

瘋狂挖人的 Meta，終于在今天發(fā)布了最新 AI 研發(fā)成果！代碼世界模型 CWM 是本次發(fā)布的模型，創(chuàng)新性地將世界模型引入了代碼生成任務(wù)中。這是否會(huì)成為編程模型新范式？

瘋狂挖人的 Meta，終于把他們的 AI 研發(fā)新成果端上來了！

就在今天，Meta 官宣發(fā)布了一款名為代碼世界模型（Code World Model，CWM）的 LLM，探索如何使用世界模型改進(jìn) AI 代碼生成性能。

Yann LeCun 也親自下場(chǎng)轉(zhuǎn)發(fā)撐場(chǎng)子了。

CWM 究竟有哪些創(chuàng)新點(diǎn)？這個(gè) 32B 的參數(shù)相對(duì)較小的大模型，究竟有多強(qiáng)？

CWM 創(chuàng)新點(diǎn)

本次發(fā)布的 CWM，最大的創(chuàng)新點(diǎn)是，將世界模型引入了代碼生成任務(wù)中。

簡(jiǎn)言之，該模型的核心正如 Yann LeCun 所言：生成代碼時(shí)，通過提前預(yù)測(cè)即將生成的代碼指令可能產(chǎn)生的效果，來更好地規(guī)劃出能夠滿足人類期望達(dá)成的效果的代碼，從而改進(jìn)生成代碼的質(zhì)量。

當(dāng)人類進(jìn)行規(guī)劃時(shí)，我們會(huì)設(shè)想不同行動(dòng)可能產(chǎn)生的結(jié)果。

當(dāng)人類思考代碼時(shí)，會(huì)在腦海中模擬其部分執(zhí)行過程。

而目前市面上的主流語言模型，還很難做到這一點(diǎn)。

專門訓(xùn)練一個(gè)代碼世界模型，補(bǔ)足這一點(diǎn)，生成代碼的效果會(huì)不會(huì)好很多，是 Meta 要通過本次發(fā)布的 CWM 驗(yàn)證的猜想。

CWM 基于大量編程數(shù)據(jù)，加上專門定制的 Python 和 Bash（Linux 和 macOS 的命令行解釋器腳本語言）的世界建模數(shù)據(jù)，進(jìn)行該模型的訓(xùn)練。

通過這種訓(xùn)練，CWM 能夠模擬 Python 程序在 Bash 環(huán)境中的執(zhí)行及與 Agent 之間的交互。

對(duì)于「數(shù)數(shù) strawberry 中有多少個(gè) r」這個(gè)難倒無數(shù)大模型的問題，CWM 也用類似 pdb（Python Debug 用的調(diào)試器）的形式演示了其工作流程：

CWM 直接發(fā)布了 3 個(gè)不同的 Checkpoint，用于不同目的。

CWM 性能測(cè)試

「光說不練假把式」，我們直接看看這個(gè) 32B 的小參數(shù)大模型在各類編程基準(zhǔn)測(cè)試中的表現(xiàn)如何。

SWE-bench Verified 是一個(gè)真實(shí)開源項(xiàng)目修復(fù)的最常用的編程評(píng)測(cè)標(biāo)準(zhǔn)，讓模型在真實(shí)的大型開源倉庫里，根據(jù) GitHub issue+failing tests，定位并修復(fù)缺陷，最終以自動(dòng)化測(cè)試是否全部通過來判定是否解決。

在該項(xiàng)測(cè)試中，32B 小參數(shù)的 CWM 成績(jī)?yōu)?65.8%，遜于 Qwen3-Coder 和 Kimi-K2-Instruct，與閉源的 Gemini-2.5-Thinking 接近，屬于開源陣營(yíng)第一梯隊(duì)了。

其他測(cè)試成績(jī) Alexandr Wang 也直接發(fā)出來了：

LiveCodeBench：68.6%

Math-500：96.6%

AIME 2024：76.0%

CWM 模型算是 Meta 的一次概念驗(yàn)證，投入了不算多的算力訓(xùn)練這個(gè)小參數(shù)大模型，主要是為了檢驗(yàn)將世界模型引入代碼生成任務(wù)是否會(huì)顯著提高生成代碼質(zhì)量。

換言之，我們今日看到的這個(gè)模型只能算 Demo。大的還在后面？

參考資料：

https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/

https://x.com/syhw/status/1970960837721653409

https://x.com/AIatMeta/status/1970963571753222319

https://x.com/ylecun/status/1970967341052854748

https://x.com/alexandr_wang/status/1970973317227225433

本文來自微信公眾號(hào)：新智元（ID：AI_era）

本文鏈接：http://www.www897cc.com/showinfo-45-28134-0.htmlLeCun 團(tuán)隊(duì)開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：京東探索研究院升級(jí)，劉強(qiáng)東將親自擔(dān)任院長(zhǎng)

下一篇： OpenAI 最強(qiáng) AI 智能體曝光：基于 GPT-5，輕松駕馭寫作、編程、生圖等任務(wù)

標(biāo)簽：

熱門焦點(diǎn)

數(shù)字虛擬人23年最新變化！

作者：小資來源：米塔之家自2021年元宇宙“爆炸”后，作為現(xiàn)實(shí)世界連接元宇宙的媒介之一，大批虛擬人跑步入場(chǎng)。到了2022年底，據(jù)天眼查數(shù)據(jù)顯示，我國(guó)目前企業(yè)名稱或經(jīng)營(yíng)范圍
AIGC產(chǎn)品測(cè)評(píng)TOP25丨誰能搶到下個(gè)十年的“船票”？

Tech星球（微信ID：tech618）文 | 何煦陽策劃 | 楊曉鶴封面來源 | 圖蟲創(chuàng)意 2016年，李彥宏站在百度聯(lián)盟峰會(huì)的講臺(tái)上，向所有人宣布：互聯(lián)網(wǎng)的下一幕是人工智能。同年，Google 旗下 Dee
字節(jié)跳動(dòng)，剛剛投了一位虛擬女生

今年第一筆虛擬人融資出爐了。投資界獲悉，杭州李未可科技有限公司顯示發(fā)生股東變更，新增字節(jié)跳動(dòng)關(guān)聯(lián)公司北京量子躍動(dòng)科技有限公司。今天公司方面正式確認(rèn)，本輪
元宇宙畫廊體驗(yàn)報(bào)告：有點(diǎn)頭疼。

2 月 10 日，Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強(qiáng)現(xiàn)實(shí)藝術(shù)品?！拔覀儸F(xiàn)在在虛擬世界中嗎？時(shí)間好像變長(zhǎng)了” 我問身后排隊(duì)的人。我
NFT行業(yè)的三大區(qū)塊鏈之一引起了Snoop Dogg的強(qiáng)烈興趣，究竟有何潛力？

Block-810多個(gè)區(qū)塊鏈吸引了希望創(chuàng)建單個(gè)NFT或整個(gè)集合的用戶的注意。Tezos是其中因其低費(fèi)用和低碳排放方式而備受贊譽(yù)的區(qū)塊鏈，就連Snoop Dogg也希望通過公開他
新聞業(yè)在元宇宙的現(xiàn)狀和未來

“美聯(lián)社有毛病吧，這真的過分了！”，一位媒體編輯在推特中憤怒地表示。這是針對(duì)一款視頻NFT的批評(píng)言論之一，之后取消了此次銷售，因?yàn)樵撘曨l呈現(xiàn)了移民穿越地中海的苦
FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

據(jù)媒體報(bào)道，業(yè)內(nèi)領(lǐng)先的加密貨幣交易所FTX宣布將涉足游戲領(lǐng)域。該公司表示，計(jì)劃推出自己的游戲部門作為中介，專注于為傳統(tǒng)游戲公司提供加密相關(guān)服務(wù)。此舉將有助于
多位全國(guó)政協(xié)委員提交元宇宙提案，國(guó)金證券稱元宇宙仍處初期投資階段

財(cái)聯(lián)社|區(qū)塊鏈日?qǐng)?bào)2日訊今日《元宇宙新鮮事》有：全國(guó)政協(xié)委員劉偉建議出臺(tái)“元宇宙中國(guó)”的頂層設(shè)計(jì)方案；國(guó)金證券稱元宇宙仍處初期投資龐大獲利不易階段；阿聯(lián)酋
虛擬鄧麗君后，數(shù)字人賽道開啟3.0時(shí)代

“如果右腦時(shí)代來臨，虛擬世界將是對(duì)人類才華的無限放大?！?郭曉喆稱，開發(fā)數(shù)字人形象時(shí)，自己的團(tuán)隊(duì)在內(nèi)部“卷”了一下：“當(dāng)我們翻閱大量歷史典籍的時(shí)候，蘇小妹找到

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

LeCun 團(tuán)隊(duì)開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

數(shù)字虛擬人23年最新變化！

AIGC產(chǎn)品測(cè)評(píng)TOP25丨誰能搶到下個(gè)十年的“船票”？

字節(jié)跳動(dòng)，剛剛投了一位虛擬女生

元宇宙畫廊體驗(yàn)報(bào)告：有點(diǎn)頭疼。

NFT行業(yè)的三大區(qū)塊鏈之一引起了Snoop Dogg的強(qiáng)烈興趣，究竟有何潛力？

新聞業(yè)在元宇宙的現(xiàn)狀和未來

FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

多位全國(guó)政協(xié)委員提交元宇宙提案，國(guó)金證券稱元宇宙仍處初期投資階段

虛擬鄧麗君后，數(shù)字人賽道開啟3.0時(shí)代

最新推薦

數(shù)字人的AB面：在元宇宙中過氣，在AIGC中重生

上、中、下游加深融合，搭建元宇宙產(chǎn)業(yè)全景

英特爾首款加密芯片將于今年上市｜國(guó)際動(dòng)態(tài)

以太坊倫敦升級(jí)后，隨之生效的以太坊EIP-1559是什么？

Web 3如何改變傳統(tǒng)HR

元宇宙存在的意義和價(jià)值

猜你喜歡

熱門推薦

相關(guān)資訊

LeCun 團(tuán)隊(duì)開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

LeCun 團(tuán)隊(duì)開源首款代碼世界模型，能像程序員一樣思考的 LLM 來了