【新智元導讀】老黃新 GPU 深夜炸場,超高規格的背后也付出了不小的代價,小編帶大家深入了解一下新架構的硬件細節和成本,新顯卡的售價究竟高不高?英偉達也不得不開始卷了
老黃的新 GPU 又在深夜炸場,震撼了所有的觀眾。
除了硬件參數上的震撼之外,大家伙最想知道的還是新 GPU 的售價會不會同樣震撼。
下面就讓我們從規格參數、工藝節點、封裝設計等方面來深入分析一下新一代 Blackwell GPU 的系統、定價、利潤,以及 Jensen's Benevolence(老黃的仁慈)
在這個大模型的時代,英偉達正處于世界之巔,擁有至高無上的定價權。
需要 AI 算力的用戶沒有更好的選擇,于是不得不接受英偉達「用銀湯匙喂給他們的東西」,—— 毛利率超過 85% 的 H100 就是最好的例子。
而這一代 B100 在性能和總體擁有成本方面的優勢依然保持不變,超越了 AMD 的 MI300X、英特爾的 Gaudi 3。
不過這次新系列 GPU 的定價,可能會讓很多人大吃一驚,也許我們會說「B」代表的不是「Blackwell」架構,而是「Benevolence」(老黃的仁慈)。
—— 因為 AI 時代的主宰和救世主黃仁勛正在向全世界微笑,尤其是對于「GPU-poor」(缺乏 GPU 的用戶)來說。
B100 / B200 規格首先,Blackwell 架構將 2 個 GPU 芯片粘在了一起,而工藝制程仍然保持在 4nm,跟上一代的 Hopper 架構一樣。
—— 在以往發布的最新數據中心 GPU 上,英偉達都會采用更新的工藝制程,而這一次沒有。
這是因為臺積電最初的 3 納米 N3B 工藝存在問題,所以英偉達不僅沒有吃到提升制程的紅利,還不得不把硅片的總量增加一倍。
此外,新架構使用了 8-hi HBM3E,容量高達 192GB,這些顯存的供應商是 SK Hynix 和 Micron。
盡管其中絕大部分來自 SK Hynix,但這也改變了 SK Hynix 作為 H100 顯存唯一供應商的局面。
至于早就宣布要開發 "世界上最快" 的 HBM3E 的三星,目前仍然差點意思。
GPU 的進化趨勢是在更大的封裝中使用更多的硅片(包括邏輯和存儲器),而目前硅基插值器(silicon-based interposers)的尺寸已達到極限。
尺寸的增大會使硅片的生產面臨更多問題,從而降低產量。相比于上一代,B100 的封裝尺寸要大得多,它將成為首款采用 CoWoS-L 的大容量產品(CoWoS-L 是一種帶有無源硅橋的有機 RDL 基底面)。
Blackwell 的第一個版本代號叫 Umbriel,它保留了前代 PCIe Gen 5、400G 網絡等,B100 風冷式 700W 甚至可以無縫接入現有的 H100 和 H200 服務器底板。
不過 B200 的功率上限將提高到 1000W,就需要重新設計服務器了。當然也有信息顯示,1000W 版本仍然可以采用風冷方式,令人感到意外。
標準版 GPU 的代號是 Miranda,擁有 PCIe Gen 6 和 800G 的網絡,而顯存容量更是高達 192GB。
目前,英偉達已經買斷了所有 36GB HBM 的供應,SK Hynix 和 Micron 將在明年初開始生產。這意味著,每塊 GPU 的容量實際上可以達到 288GB。
GB200 平臺在供應鏈中,每個人都在討論的產品是 Oberon GB200 平臺,新平臺解決了 GH200 的許多問題。
首先,GB200 將所需的 CPU 數量減半,從而在總體擁有成本(TCO)上占據了優勢。——GH200 的價格實在是太貴了,而大多數的 AI 負載,實際上用不到服務器上昂貴的英偉達 Grace CPU 所提供的功能。
很多時候,GH200 中的 Grace 芯片只是充當了世界上最昂貴的內存控制器。在可以單獨購買 GPU 的場景下,基本上所有 AI 大公司都會選擇買更多的 GPU,而不是英偉達的 CPU。
另一方面,英偉達正試圖銷售帶液體冷卻的集成機架。
英偉達不愿意單賣 GPU 或者 NVSwitch,雖然讓一些用戶感到不滿,但由于交換機背板、電源匯流排和冷卻系統的集成度要求很高,也算是無可厚非。
在新的液冷機架中,CPU、GPU、NVSwitches 和 ConnectX7 網卡全部采用水冷技術。
機架有兩個版本:一種是 120kW,可容納 72 個 GPU(總功率有點過分了),機架頂部有 10 個計算托盤,中間有 9 個 NVSwitch 托盤,底部有 8 個計算托盤。
每個計算托盤包含 4 個 GPU、4 個網卡、2 個 CPU、768GB HBM 和 2,000GB LPDDR5X。這個版本會晚一些上市。
另一種是功率較低的版本,這版本的機架有 36 個 GPU 和 9 個計算托盤,可以通過 NVLink 擴展連接兩個機架。
對大多數公司來說,這個版本可能更容易部署。英偉達已通知機架的 ODM 廠商準備明年生產 50,000 個機架。
被卷到了盡管 B100 為最終用戶提供了更好的性價比,但本身的制造成本卻增加了一倍以上。
SemiAnalysis 表示,對于大批量超大規模定價,B100 基板的平均售價僅僅約 240,000 美元。這對許多人來說是一個驚喜,因為這遠低于 ASP 逐代增長 50% 的預期。
那么為什么老黃的定價會如此仁慈?答案是被卷到了。
AMD 的 MI300 目前成為了合格的競爭對手,已經成功拿到了英偉達最大的兩個客戶 Meta 和微軟的大訂單,盡管 AMD 為此承擔了很大的技術風險、并盡力降低了利潤。
而另一方面,英偉達的所有主要客戶都在設計自己的芯片。雖然迄今為止,只有谷歌取得了成功,但亞馬遜仍在繼續推出 Inferentia 和 Trainium,Meta 也在長期押注 MTIA,微軟同樣開啟了芯片之旅。
很明顯,生產成本翻倍,但售價增加得不算太多,B100 的利潤率肯定是趕不上前代了。
H200 也是如此,它的 ASP 與 H100 相同,但 HBM 顯著增加,從而增加了 BOM。
而 H20 則更糟糕,盡管價格賣的更低,但實際上它與 H100 使用了相同的 GPU 芯片,HBM 容量也從 80GB 增加到 96GB,因此總體 BOM 成本實際上也增加了。
—— 以上的分析雖然聽起來很可怕,不過別擔心,毛利率只會再下降幾個百分點而已。
SemiAnalysis 對此評價道:“英偉達更關心毛利潤和市場份額,而不是毛利率。過分擔心幾個百分點是精打細算的人所做的事情,而不是像黃仁勛這樣的有遠見的人所做的,他想以仁慈的計算獨裁者的身份統治世界。”
畢竟,英偉達在數據中心上的收入持續飆升,并且正在實現供應鏈多元化,從 800G 收發器到電力傳輸組件,—— 老黃正在下一盤大棋。
也許,隨著時代的發展,英偉達這個顯卡帝國可能不得不轉換成防御形態,因為硬件和軟件上的護城河,都不會永遠堅不可摧。
但也許,新的帝國正在誕生之中。
參考資料:
https://www.semianalysis.com/p/nvidia-b100-b200-gb200-cogs-pricing
本文來自微信公眾號:新智元 (ID:AI_era)
本文鏈接:http://www.www897cc.com/showinfo-45-3857-0.html英偉達開卷價格!最新 Blackwell GPU 架構 成本揭秘,彰顯老黃的「仁慈」
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com