快科技8月29日消息,NVIDIA日前發(fā)布了2季度財(cái)報(bào),業(yè)績依然暴漲,新一代AI顯卡Blackwell系列中的強(qiáng)者GB300今年4季度也會(huì)正式上市,下下代的Rubin有6款產(chǎn)品正在推進(jìn)。
GB300的詳細(xì)規(guī)格可以參考之前的文章,這里要來看一個(gè)可能影響中美AI技術(shù)的變化,那就是在算法選擇上,國產(chǎn)的AI跟NVIDIA已經(jīng)有了分裂,前者選擇的是UE8M0 FP8,而在Blackwell上NVIDIA強(qiáng)化的是NVFP4標(biāo)準(zhǔn)。
UE8M0 FP8這幾天引爆了國產(chǎn)算力行業(yè),這是Deepseek 3.1正式問世時(shí)DS官方公布的消息,稱UE8M0 FP8已經(jīng)全面適配即將發(fā)布的新一代國產(chǎn)AI芯片。
雖然沒有特指哪家廠商,但是華為昇騰、摩爾線程、礪算科技、芯原科技、海光科技等廠商的新一代算力芯片幾乎都會(huì)支持這個(gè)標(biāo)準(zhǔn)。
相比之前國產(chǎn)AI算力芯片主要采用FP16+INT8的算法標(biāo)準(zhǔn),UE8M0 FP8帶來的好處很多,性能是之前的2-3倍,并且大幅降低顯存壓力,還能降低功耗,具體就要看各大廠商的實(shí)現(xiàn)了。
那作為AI一哥的NVIDIA呢?相比國內(nèi)AI領(lǐng)域率先有DS這種模型廠商來協(xié)同算法標(biāo)準(zhǔn)的情況,NVIDIA這幾年一直以算力芯片上游廠商的身份來推動(dòng)標(biāo)準(zhǔn),F(xiàn)P64、FP32、FP16、INT8、FP8等標(biāo)準(zhǔn)都是支持的,而在Blackwell架構(gòu)上,NVIDIA也支持FP4、MXFP4這兩種標(biāo)準(zhǔn),但重點(diǎn)推的是NVFP4,它跟E2M1 FP4結(jié)構(gòu)差不多,但精度幾乎沒有多少損失。

NVFP4標(biāo)準(zhǔn)的優(yōu)點(diǎn)有哪些?首先來看性能上的,GB300的稠密性能大幅提升了50%而來到15PFlops,要知道它跟GB200基本架構(gòu)可沒什么變化。

50%的性能提升或許不夠驚人,那再來看看精度變化。

與FP8的基準(zhǔn)相比,NVFP4在DS 0528的模型精度上幾乎持平,大部分落后不到1個(gè)百分點(diǎn),AIME 2024中甚至還領(lǐng)先了2個(gè)百分點(diǎn)。
在內(nèi)存使用上,NVFP4與FP16相比占用減少了3.5倍,相比FP8也減少了1.8倍,而GB300顯卡HBM容量也從GB200的186GB提升到了288GB,同樣的NVL72機(jī)柜中,系統(tǒng)的總內(nèi)存容量可達(dá)40TB,能支持3000億參數(shù)的大模型。

第三個(gè)優(yōu)勢則是在能效上,GB300在NVFP4的支持下,每Token的能量消耗只有0.2J,GB200則是0.4J,H100架構(gòu)的H100是10J,相比之下提升了50倍的能效。
簡單來說,NVIDIA這次主導(dǎo)的NVFP4算法標(biāo)準(zhǔn)性能提升了50%,精度比FP8幾乎沒有損失,內(nèi)存占用大幅減少2-3倍,能效則是50倍提升。
考慮到NVIDIA的影響力,NVFP4顯然會(huì)成為前沿大模型廣泛使用的算法標(biāo)準(zhǔn),國內(nèi)大廠應(yīng)該也會(huì)大規(guī)模使用。
但在國產(chǎn)AI芯片上,UE8M0 FP8也已經(jīng)成為新一代AI芯片的標(biāo)準(zhǔn),盡管它還不能超越NVIDIA的CUDA生態(tài),但是這顯然也是國產(chǎn)AI軟件及硬件領(lǐng)域的一次重大協(xié)同,同樣有機(jī)會(huì)殺出重圍,或許也能打造出自己的優(yōu)勢范圍呢,一切都有可能。

本文鏈接:http://www.www897cc.com/showinfo-24-179551-0.html與國產(chǎn)AI分裂 NVIDIA強(qiáng)AI顯卡GB300強(qiáng)化FP4:能效暴增50倍
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com