6 月 27 日消息,據(jù)外媒 The Information 報道,由于美國當局策略致英偉達H20 芯片在中國內(nèi)地供應(yīng)短缺,繼而導(dǎo)致DeepSeek-R2 AI模型開發(fā)工作延遲。
注意到,DeepSeek使用了5萬塊 Hopper GPU訓(xùn)練 R1 模型,其中包括 3 萬塊 H20、1 萬塊 H800 和 1 萬塊 H100。
外媒援引兩位知情人士透露,DeepSeek 團隊近幾個月一直在密集推進 R2 模型開發(fā),但 CEO 梁文鋒目前對模型的能力仍不滿意,內(nèi)部仍在繼續(xù)提升性能,相應(yīng)模型尚未準備好正式投用。
此外,相應(yīng)報道同時指出,多數(shù)用戶都是在英偉達的 H20 芯片上部署 / 運行現(xiàn)有DeepSeek-R1 模型,隨著 H20 芯片遭美國當局限制出口,除了令DeepSeek R2 的研發(fā)更加困難外,也對現(xiàn)有DeepSeek-R1實際部署造成一定影響。
本文鏈接:http://www.www897cc.com/showinfo-45-14216-0.html消息稱 DeepSeek-R2 AI 模型開發(fā)進程因美國當局英偉達 H20 芯片出口限制而延遲
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 去年出價被嫌太低,消息稱 CoreWeave 再度謀求收購 Core Scientific 實現(xiàn)“AI 公司與礦商整合”