日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

Meta Llama 4 發布 36 小時“差評如潮”,匿名員工爆料拒絕署名技術報告

來源: 責編: 時間:2025-04-09 12:34:55 81觀看
導讀 Meta 最新基礎模型 Llama 4 發布 36 小時后,評論區居然是這個畫風:失望,非常失望不知道他們后訓練怎么搞的,總之不太行在 [各種測試] 中失敗……還被做成表情包調侃,總結起來就是一個“差評如潮”。具體來看,大家的

Meta 最新基礎模型 Llama 4 發布 36 小時后,評論區居然是這個畫風:bXW28資訊網——每日最新資訊28at.com

失望,非常失望bXW28資訊網——每日最新資訊28at.com

不知道他們后訓練怎么搞的,總之不太行bXW28資訊網——每日最新資訊28at.com

在 [各種測試] 中失敗bXW28資訊網——每日最新資訊28at.com

……bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

還被做成表情包調侃,總結起來就是一個“差評如潮”。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

具體來看,大家的抱怨主要集中在代碼能力。bXW28資訊網——每日最新資訊28at.com

最直觀的要數經典“氛圍編程”小球反彈測試,小球直接穿過墻壁掉下去了。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

反映在榜單上,成績也相當割裂。bXW28資訊網——每日最新資訊28at.com

發布時的官方測評(LiveCodeBench)分數和在大模型競技場表現明明都很不錯。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

但到了各種第三方基準測試中,情況大多直接逆轉,排名末尾。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

讓人不由得懷疑,這個競技場排名到底是數據過擬合,還是刷票了。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

就在 Llama 4 即將發布前幾天,Meta AI 研究主管 Joelle Pineau 在工作 8 年之后突然宣布離職,總之就是不太妙。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

Llama 4 怎么了?

大模型關注者們火熱實測吐槽之際,一則有關 Llama 4 的匿名爆料,突然引起軒然大波:bXW28資訊網——每日最新資訊28at.com

有網友稱自己已向 Meta GenAI 部門提交辭職,并要求不要署名在 Llama 4 的技術報告上。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

原貼發布在海外留學求職交流平臺一畝三分地,在國內也引起很多討論。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

此爆料尚未得到證實,但有人搬出 Meta GenAI 負責人 Ahmad Al-Dahle 的帖子,至少能看出在 Llama 4 大模型競技場里運行的是特殊版本模型。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

還有 Meta 前員工借此話題貼出 2024 年 11 月的一項研究,指出從 Llama 1 開始數據泄露的問題就存在了。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

也不只是編程能力一個方面有問題,在 EQBench 測評基準的的長文章寫作榜中,Llama 4 系列也直接墊底。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

榜單維護者_sqrkl 說明了具體情況。bXW28資訊網——每日最新資訊28at.com

測試非常簡單,模型需要先完成一個短篇小說的頭腦風暴、反思并修改寫作計劃,最終每輪寫 1000 字,重復 8 輪以上。bXW28資訊網——每日最新資訊28at.com

由 Claude-Sonnet 3.7 來當裁判,先對每個章節單獨打分,再對整個作品打分。bXW28資訊網——每日最新資訊28at.com

Llama 4 的低分表現在寫到后面開始大段的內容重復,以及寫作非常公式化。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

對此結果,有一個猜想是之前的版權訴訟讓 Meta 刪除了網絡和書籍數據,使用了更多的合成數據。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

在這場訴訟中,許多作家發現自己的作品可能被用于 AI 訓練,還到倫敦的 Meta 辦公室附近發起抗議。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

Llama 4 發布后的種種,讓人聯想到年初的匿名員工爆料,有網友表示當初只是隨便看看,現在卻開始相信了:bXW28資訊網——每日最新資訊28at.com

在這條爆料中,Deepseek V3 出來之后,訓練中的 Llama4 就顯得落后了,中層管理的薪水都比 DeepSeek V3 的訓練成本都高,Meta 內部陷入恐慌模式。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

讓人不由得感嘆,DeepSeek-R1 橫空出世僅僅兩個月時間,卻像過了幾輩子。bXW28資訊網——每日最新資訊28at.com

bXW28資訊網——每日最新資訊28at.com

參考鏈接:bXW28資訊網——每日最新資訊28at.com

[1]https://www.reddit.com/r/LocalLLaMA/comments/1jt7hlc/metas_llama_4_fell_short/bXW28資訊網——每日最新資訊28at.com

[2]https://www.1point3acres.com/bbs/thread-1122600-1-1.htmlbXW28資訊網——每日最新資訊28at.com

[3]https://x.com/suchenzang/status/1909070231517143509bXW28資訊網——每日最新資訊28at.com

https://x.com/TheAhmadOsman/status/1908833792111906894bXW28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:夢晨,原標題《Llama 4 發布 36 小時差評如潮!匿名員工爆料拒絕署名技術報告》bXW28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12086-0.htmlMeta Llama 4 發布 36 小時“差評如潮”,匿名員工爆料拒絕署名技術報告

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 2025 商湯技術交流日 4 月 10 日舉行,日日新 6.0“強推理”模型首秀

下一篇: 我國電力領域迎新里程碑:特高壓直流量子電流傳感器成功投運

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 青海省| 怀化市| 内乡县| 都昌县| 浠水县| 东台市| 太仆寺旗| 常山县| 建昌县| 灵武市| 德化县| 平山县| 固始县| 深泽县| 潜江市| 绥阳县| 平顺县| 柘荣县| 中江县| 双柏县| 呼图壁县| 称多县| 凤城市| 鹤岗市| 稻城县| 天峨县| 湖南省| 出国| 隆化县| 陆川县| 海门市| 黄骅市| 桑日县| 天柱县| 博乐市| 永修县| 南丹县| 海淀区| 绍兴县| 晴隆县| 万荣县|