快科技1月27日消息,近一周,中國(guó)的神秘AI公司、被稱為“AI界拼多多”的人工智能初創(chuàng)企業(yè)深度求索(DeepSeek)刷屏全球各大主流媒體和社交網(wǎng)站,尤其讓美國(guó)AI科技圈極為震撼。
其新發(fā)布的R1模型不僅在性能上比肩甚至超越了OpenAI的 o1,并完全開源,且以極低的成本實(shí)現(xiàn)了這一突破。
左為梁文鋒
1月20日,極少露面的DeepSeek老板梁文鋒首次亮相新聞聯(lián)播,受邀參加座談會(huì)并發(fā)言。同一天,DeepSeek在官微上,發(fā)布了DeepSeek-R1發(fā)布,性能對(duì)標(biāo)OpenAI o1正式版,并同步開源模型權(quán)重。
按照官方說法,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。
DeepSeek-R1 API 服務(wù)定價(jià)為每百萬輸入tokens 1 元(緩存命中)/ 4元(緩存未命中),每百萬輸出tokens 16元。
對(duì)比OpenAI o1的 API定價(jià):每百萬輸入tokens 15美元、每百萬輸出tokens 60美元。
也就是說,每百萬輸出定價(jià),DeepSeek-R1大概僅為OpenAI o1的3.65%,擁有極高的性價(jià)比。
更讓人驚訝的是,DeepSeek-V3在僅使用2048塊H800 GPU的情況下,完成了6710億參數(shù)模型的訓(xùn)練,成本僅為557.6萬美元,遠(yuǎn)低于其他頂級(jí)模型的訓(xùn)練成本(如GPT-4的10億美元)。
因此,一些人認(rèn)為,DeepSeek可能會(huì)顛覆NVIDIA在AI硬件領(lǐng)域的主導(dǎo)地位。
1月24日,在國(guó)外大模型排名Arena上,DeepSeek-R1基準(zhǔn)測(cè)試已經(jīng)升至全類別大模型第三,其中在風(fēng)格控制類模型(StyleCtrl)分類中與OpenAI o1并列第一。
就在Arena放榜之后,全球關(guān)于DeepSeek的討論再次升級(jí)。
NVIDIA的高級(jí)研究科學(xué)家Jim Fan(范麟熙)評(píng)價(jià)道:“我們生活在這樣一個(gè)時(shí)代:一家非美國(guó)公司正在讓OpenAI的初衷得以延續(xù)——真正開放、為所有人賦能的前沿研究。”
1月25日,NVIDA的“老對(duì)手”AMD火速為DeepSeek“站臺(tái)”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。
美國(guó)私人投資基金Noah's Arc Capital Management認(rèn)為,DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本,使AMD GPU成為比NVIDIA更具有成本效益的替代品,增強(qiáng)了AMD的市場(chǎng)地位。
那DeepSeek-R1為何讓美國(guó)乃至全球的AI圈有如此大的反應(yīng)?因?yàn)樗黄屏艘粋€(gè)規(guī)則,一個(gè)由美國(guó)和OpenAI建立起的規(guī)則。
以往,全球AI的底層發(fā)展路線,是由OpenAI引領(lǐng)的,倡導(dǎo)“大力出奇跡”,以規(guī)模制勝。但也種“軍備競(jìng)賽”的發(fā)展模式也將AI發(fā)展帶入了一個(gè)怪圈,為追求更高的性能,大模型的體積只能不斷膨脹,參數(shù)數(shù)量呈現(xiàn)指數(shù)級(jí)增長(zhǎng),同時(shí)帶來了驚人的能源消耗和訓(xùn)練成本,一家公司想發(fā)展AI,就必須投入高昂的成本向NVIDIA買GPU訓(xùn)練,絕大多數(shù)公司根本難以為繼。
但DeepSeek的誕生,讓低成本、高性能AI成為了可能。大模型對(duì)算力投入的需求可能會(huì)從訓(xùn)練側(cè)向推理側(cè)傾斜,即未來對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力。而NVIDIA等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),這可能會(huì)對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。
要知道,前不久美國(guó)總統(tǒng)特朗普剛剛在白宮宣布,日本軟銀集團(tuán)、美國(guó)開放人工智能研究中心和美國(guó)甲骨文公司三家企業(yè)將投資5000億美元,用于在美國(guó)建設(shè)支持人工智能(AI)發(fā)展的基礎(chǔ)設(shè)施。
美股大V“THE SHORT BEAR”在社交媒體上表示,DeepSeek創(chuàng)造了一個(gè)AI巨頭們的痛苦時(shí)刻,根據(jù)紅杉,美國(guó)AI公司每年必須產(chǎn)生約6000億美元收入來支付其AI硬件費(fèi)用。但現(xiàn)在看來,這種冒險(xiǎn)行為變得越來越無利可圖!
還有不少人把DeepSeek稱為“美國(guó)股市大的威脅”,甚至把DeepSeek與近期NVIDIA的回調(diào)聯(lián)系在一起。1月24日,NVIDIA股價(jià)大跌3.12%,創(chuàng)下公司在年初CES展產(chǎn)品不及預(yù)期表現(xiàn)后的大跌幅。
更重要的是,DeepSeek來自中國(guó)!一家名不見經(jīng)傳的“小公司”!
“在美國(guó)每天發(fā)生的大量創(chuàng)新里,這是非常普通的一個(gè)。他們之所以驚訝,是因?yàn)檫@是一個(gè)中國(guó)公司,在以創(chuàng)新貢獻(xiàn)者的身份,加入到他們游戲里去。畢竟大部分中國(guó)公司習(xí)慣 follow,而不是創(chuàng)新。” 梁文鋒說。
他認(rèn)為,中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置。我們經(jīng)常說中國(guó)AI和美國(guó)有一兩年差距,但真實(shí)的gap是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的。
NVIDIA的領(lǐng)先,不只是一個(gè)公司的努力,而是整個(gè)西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果。他們能看到下一代的技術(shù)趨勢(shì),手里有路線圖。中國(guó) AI 的發(fā)展,同樣需要這樣的生態(tài)。
很多國(guó)產(chǎn)芯片發(fā)展不起來,也是因?yàn)槿狈ε涮椎募夹g(shù)社區(qū),只有第二手消息,所以中國(guó)必然需要有人站到技術(shù)的前沿。
本文鏈接:http://www.www897cc.com/showinfo-17-127584-0.html登上新聞聯(lián)播的DeepSeek震撼美國(guó)!5000億美元要白花了嗎
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com