6 月 27 日消息,據(jù)外媒 The Information 報(bào)道,由于美國(guó)當(dāng)局策略致英偉達(dá)H20 芯片在中國(guó)內(nèi)地供應(yīng)短缺,繼而導(dǎo)致DeepSeek-R2 AI模型開發(fā)工作延遲。
注意到,DeepSeek使用了5萬(wàn)塊 Hopper GPU訓(xùn)練 R1 模型,其中包括 3 萬(wàn)塊 H20、1 萬(wàn)塊 H800 和 1 萬(wàn)塊 H100。
外媒援引兩位知情人士透露,DeepSeek 團(tuán)隊(duì)近幾個(gè)月一直在密集推進(jìn) R2 模型開發(fā),但 CEO 梁文鋒目前對(duì)模型的能力仍不滿意,內(nèi)部仍在繼續(xù)提升性能,相應(yīng)模型尚未準(zhǔn)備好正式投用。
此外,相應(yīng)報(bào)道同時(shí)指出,多數(shù)用戶都是在英偉達(dá)的 H20 芯片上部署 / 運(yùn)行現(xiàn)有DeepSeek-R1 模型,隨著 H20 芯片遭美國(guó)當(dāng)局限制出口,除了令DeepSeek R2 的研發(fā)更加困難外,也對(duì)現(xiàn)有DeepSeek-R1實(shí)際部署造成一定影響。
本文鏈接:http://www.www897cc.com/showinfo-45-14216-0.html消息稱 DeepSeek-R2 AI 模型開發(fā)進(jìn)程因美國(guó)當(dāng)局英偉達(dá) H20 芯片出口限制而延遲
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 去年出價(jià)被嫌太低,消息稱 CoreWeave 再度謀求收購(gòu) Core Scientific 實(shí)現(xiàn)“AI 公司與礦商整合”
下一篇: 螞蟻集團(tuán)發(fā)布 AI 健康應(yīng)用 AQ:可看病癥、看醫(yī)生、看報(bào)告