快科技擬8月15日消息,GPT5都已經發布了,為什么DeepSeek R2遲遲沒有來呢?
據國內媒體報道稱,DeepSeek在使用昇騰芯片訓練R2的過程中遇到了持續的技術問題,促使其使用英偉達芯片進行訓練,并使用華為芯片進行推理。
報道中提到,華為已派了一個工程師團隊前往DeepSeek,幫助使用昇騰芯片開發R2模型,不過目前進展已經緩慢,遇到的問題比較多(應該主要是散熱方面所致)。
之所以進展緩慢,主要因昇騰平臺在訓練任務中的穩定性不足、軟硬件支持不完善,以及芯片之間通信速度較慢等。
不過,DeepSeek仍在與華為進行合作,以確保其模型與昇騰兼容以完成推理任務。
此外,對于R2模型為何遲遲未能面世,還有消息稱盡管研發團隊已投入數月高強度開發,但公司CEO梁文鋒對新模型的性能表現尚不滿意,同時DeepSeek公司或面臨算力儲備緊缺的困境。
本文鏈接:http://www.www897cc.com/showinfo-17-177454-0.html有問題也要用!DeepSeek R2因芯片問題而推遲發布:或跟華為有關
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 阿里第一代程序員退隱江湖