快科技4月29日消息,年初DeepSeek R1的問世,讓美國AI圈顫三顫,甚至引發了NVIDIA的股價暴跌。如今,更強的DeepSeek R2也要來了。
據報道,市場新爆料,R2大模型將采用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2萬億(R1總參數量為6710億),單位推理成本較GPT-4大減97.4%。
當下,中美科技戰、貿易戰愈演愈烈,NVIDIA H20芯片面臨新一波出口管制。
在DeepSeek R2預期發布時間臨近的情況下,各界高度關注中國指標性大模型在缺乏美國芯片資源下的發展動向。
據傳,R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智能的門控網絡層(Gating Network),進而優化高負載推理任務的性能。
消息指出,R2將徹底擺脫NVIDIA芯片,訓練全程均未使用NVIDIA顯卡,全部基于昇騰910B(Ascend 910B)芯片集群平臺,在FP16精度下,計算性能達到512 PetaFLOPS,芯片利用率高達82%,整體性能約為NVIDIA上一代A100集群的91%。
市場預期,這有望降低中國對海外高端AI芯片的依賴,且華為全新的昇騰910C芯片也開始進入大規模量產階段。
成本方面,DeepSeek-R2的單位推理成本較OpenAI旗下的GPT-4大減97.4%。其中,R2輸入每百萬個字符僅需0.07美元,而輸出每百萬個字符僅0.27美元。
分析認為,R2若如傳聞般強勢,可能再次引發市場對AI基礎設施需求的質疑,加上華為AI芯片的國產替代,將對NVIDIA帶來更大影響。
本文鏈接:http://www.www897cc.com/showinfo-22-148085-0.html總參數量1.2萬億 比R1提升1倍!曝DeepSeek R2將徹底擺脫NVIDIA:全部基于華為芯片
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 魅族新機被指酷似華為 博主:平凡大師