快科技1月27日消息,近一周,中國的神秘AI公司、被稱為“AI界拼多多”的人工智能初創企業深度求索(DeepSeek)刷屏全球各大主流媒體和社交網站,尤其讓美國AI科技圈極為震撼。
其新發布的R1模型不僅在性能上比肩甚至超越了OpenAI的 o1,并完全開源,且以極低的成本實現了這一突破。
左為梁文鋒
1月20日,極少露面的DeepSeek老板梁文鋒首次亮相新聞聯播,受邀參加座談會并發言。同一天,DeepSeek在官微上,發布了DeepSeek-R1發布,性能對標OpenAI o1正式版,并同步開源模型權重。
按照官方說法,DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。
DeepSeek-R1 API 服務定價為每百萬輸入tokens 1 元(緩存命中)/ 4元(緩存未命中),每百萬輸出tokens 16元。
對比OpenAI o1的 API定價:每百萬輸入tokens 15美元、每百萬輸出tokens 60美元。
也就是說,每百萬輸出定價,DeepSeek-R1大概僅為OpenAI o1的3.65%,擁有極高的性價比。
更讓人驚訝的是,DeepSeek-V3在僅使用2048塊H800 GPU的情況下,完成了6710億參數模型的訓練,成本僅為557.6萬美元,遠低于其他頂級模型的訓練成本(如GPT-4的10億美元)。
因此,一些人認為,DeepSeek可能會顛覆NVIDIA在AI硬件領域的主導地位。
1月24日,在國外大模型排名Arena上,DeepSeek-R1基準測試已經升至全類別大模型第三,其中在風格控制類模型(StyleCtrl)分類中與OpenAI o1并列第一。
就在Arena放榜之后,全球關于DeepSeek的討論再次升級。
NVIDIA的高級研究科學家Jim Fan(范麟熙)評價道:“我們生活在這樣一個時代:一家非美國公司正在讓OpenAI的初衷得以延續——真正開放、為所有人賦能的前沿研究。”
1月25日,NVIDA的“老對手”AMD火速為DeepSeek“站臺”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。
美國私人投資基金Noah's Arc Capital Management認為,DeepSeek-V3模型的突破顯著降低了AI培訓成本,使AMD GPU成為比NVIDIA更具有成本效益的替代品,增強了AMD的市場地位。
那DeepSeek-R1為何讓美國乃至全球的AI圈有如此大的反應?因為它突破了一個規則,一個由美國和OpenAI建立起的規則。
以往,全球AI的底層發展路線,是由OpenAI引領的,倡導“大力出奇跡”,以規模制勝。但也種“軍備競賽”的發展模式也將AI發展帶入了一個怪圈,為追求更高的性能,大模型的體積只能不斷膨脹,參數數量呈現指數級增長,同時帶來了驚人的能源消耗和訓練成本,一家公司想發展AI,就必須投入高昂的成本向NVIDIA買GPU訓練,絕大多數公司根本難以為繼。
但DeepSeek的誕生,讓低成本、高性能AI成為了可能。大模型對算力投入的需求可能會從訓練側向推理側傾斜,即未來對推理算力的需求將成為主要驅動力。而NVIDIA等硬件商的傳統優勢更多集中在訓練側,這可能會對其市場地位和戰略布局產生影響。
要知道,前不久美國總統特朗普剛剛在白宮宣布,日本軟銀集團、美國開放人工智能研究中心和美國甲骨文公司三家企業將投資5000億美元,用于在美國建設支持人工智能(AI)發展的基礎設施。
美股大V“THE SHORT BEAR”在社交媒體上表示,DeepSeek創造了一個AI巨頭們的痛苦時刻,根據紅杉,美國AI公司每年必須產生約6000億美元收入來支付其AI硬件費用。但現在看來,這種冒險行為變得越來越無利可圖!
還有不少人把DeepSeek稱為“美國股市大的威脅”,甚至把DeepSeek與近期NVIDIA的回調聯系在一起。1月24日,NVIDIA股價大跌3.12%,創下公司在年初CES展產品不及預期表現后的大跌幅。
更重要的是,DeepSeek來自中國!一家名不見經傳的“小公司”!
“在美國每天發生的大量創新里,這是非常普通的一個。他們之所以驚訝,是因為這是一個中國公司,在以創新貢獻者的身份,加入到他們游戲里去。畢竟大部分中國公司習慣 follow,而不是創新。” 梁文鋒說。
他認為,中國AI不可能永遠處在跟隨的位置。我們經常說中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。
NVIDIA的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手里有路線圖。中國 AI 的發展,同樣需要這樣的生態。
很多國產芯片發展不起來,也是因為缺乏配套的技術社區,只有第二手消息,所以中國必然需要有人站到技術的前沿。
本文鏈接:http://www.www897cc.com/showinfo-17-127584-0.html登上新聞聯播的DeepSeek震撼美國!5000億美元要白花了嗎
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com