2 月 3 日消息,據(jù)路透社,英偉達(dá)專為中國市場設(shè)計(jì)的 AI 芯片 H20 系列已經(jīng)開始接受經(jīng)銷商的預(yù)購,定價(jià)幾乎與國產(chǎn)的華為Ascend 910B 一致,但在某些關(guān)鍵領(lǐng)域的 FP32性能表現(xiàn)卻不如華為產(chǎn)品,不過 H20 在互連速度方面似乎比 910B 更具優(yōu)勢(shì)。

報(bào)道稱,英偉達(dá)最近幾周將 H20 的中國渠道定價(jià)設(shè)定在 12000~15000 美元(IT酷哥備注:當(dāng)前約 86280 ~ 10.8 萬元人民幣)之間。
同時(shí),一些分銷商開始對(duì)這款芯片進(jìn)行大幅加價(jià),部分渠道商的報(bào)價(jià)最高達(dá)到了約 11 萬元,而華為昇騰 910B 約為 12 萬元左右。一位消息人士透露,某經(jīng)銷商正提供的一款搭載8 顆 H20 的整機(jī)為 140 萬元。相比之下,采用 8 顆 H800 芯片的服務(wù)器一年前也只有 200 萬元左右。
消息人士補(bǔ)充說,經(jīng)銷商已告訴客戶:H20 預(yù)計(jì) 2024 年第一季開始少量出貨,而大量出貨則需等到第二季度,這一點(diǎn)與之前的爆料吻合。

根據(jù)之前的爆料,H20 是英偉達(dá)為中國市場開發(fā)的三款 AI 芯片(HGX H20、L20 PCle 和 L2 PCle)中最強(qiáng)的一款,這三款芯片均基于英偉達(dá) H100 修改而來,其算力要低于 H100 和 H800,不過在 LLM 推理場景中得益于新特性的加持可以比 H100 快 20% 以上。
作為參考,NVIDIA H100 Tensor Core GPU采用全新 Hopper 架構(gòu),基于臺(tái)積電 N4 工藝,集成了 800 億個(gè)晶體管。與上一代產(chǎn)品相比,可為多專家 (MoE) 模型提供高 9 倍的訓(xùn)練速度。
它配備第四代 Tensor Core 和 Transformer 引擎(FP8 精度),還具有高度可擴(kuò)展的 NVLink 互連技術(shù)(最多可連接達(dá) 256 個(gè) H100 GPU,相較于上一代采用 HDRQuantumInfiniBand 網(wǎng)絡(luò),帶寬高出 9 倍,帶寬速度為 900GB/s)等功能。

值得一提的是,科大訊飛副總裁江濤此前指出,目前華為昇騰 910B 能力已經(jīng)基本做到可對(duì)標(biāo)英偉達(dá) A100。
目前,華為昇騰社區(qū)已公開 Atlas 300T 產(chǎn)品有三個(gè)型號(hào),分別對(duì)應(yīng)昇騰 910A、910B、910 Pro B,最大 300W 功耗,前兩者 AI 算力均為 256 TFLOPS,而 910 Pro B 可達(dá) 280 TFLOPS(FP16)。


作為對(duì)比,英偉達(dá) A100 發(fā)布于 2020 年,采用雙精度 Tensor Core,基于 Ampere 架構(gòu),功耗達(dá)到了 400W,F(xiàn)P32 浮點(diǎn)性能 19.5TFLOPS,F(xiàn)P16 Tensor Core 性能可達(dá) 312TFLOPS。

相關(guān)閱讀:
《華為:鯤鵬通用計(jì)算平臺(tái)和昇騰 AI 開發(fā)者已經(jīng)超過 350 萬》
《科大訊飛:華為 GPU 可對(duì)標(biāo)英偉達(dá) A100,通用大模型明年上半年對(duì)標(biāo) GPT-4》
《采用 CoWoS 封裝,消息稱英偉達(dá)中國特供版 H20 在 LLM 推理中比 H100 更快》
本文鏈接:http://www.www897cc.com/showinfo-26-73234-0.html消息稱英偉達(dá)中國特供 AI 芯片 H20 已開啟預(yù)售:部分性能不如華為昇騰 910B,定價(jià) 1.2 萬美元起
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com