北京時間 6 月 13 日 00:30 消息,AMD Advancing AI 2025 正式開啟,AMD 董事長兼首席執(zhí)行官蘇姿豐博士同公司高管、AI 生態(tài)系統(tǒng)合作伙伴、客戶、開發(fā)人員,共同討論了 AMD 的產(chǎn)品和軟件將如何發(fā)展人工智能生態(tài)和高性能計(jì)算 (HPC) 領(lǐng)域的格局。
在本次大會上,AMD 全面展示了“端到端”的集成人工智能平臺發(fā)展愿景,并推出了面向 AI 的可擴(kuò)展機(jī)架級基礎(chǔ)設(shè)施產(chǎn)品組合。
首先,AMD 推出了全新一代 Instinct MI350 系列 GPU,在生成式人工智能和高性能計(jì)算領(lǐng)域?qū)崿F(xiàn)了性能、能效與可擴(kuò)展性的全方位提升。
Instinct MI350 系列包括 MI350X 和 MI355X 2 款 GPU 產(chǎn)品。在性能方面,較上一代產(chǎn)品實(shí)現(xiàn)了每代 4 倍的 AI 計(jì)算能力提升和 35 倍的推理性能飛躍,此次全新發(fā)布的 Instinct GPU 基于 AMD CDNA 4 架構(gòu),3nm 制程工藝打造,集成了 1850 億個晶體管,支持 FP4 & FP6 新一代 AI 數(shù)據(jù)類型,可提供 288GB HBM3E 顯存,支持單 GPU 上運(yùn)行高達(dá) 520B 參數(shù)的 AI 模型,支持 UBB8 行業(yè)標(biāo)準(zhǔn) GPU 節(jié)點(diǎn),可以幫助企業(yè)實(shí)現(xiàn)快速部署基礎(chǔ)設(shè)施。
AMD Instinct MI355X GPU 在 AI 和高性能計(jì)算領(lǐng)域都有著出色的表現(xiàn)。據(jù) AMD 的介紹,在與 NVIDIA B200 和 GB200 的對比中,MI355X 的顯存約為競品的 1.6 倍,內(nèi)存帶寬則基本持平。針對 FP64 和 FP32 運(yùn)算,MI355X 的峰值性能領(lǐng)先優(yōu)勢達(dá)到了競品的 2 倍。對于 FP16 和 FP8 運(yùn)算,其峰值性能與競品相當(dāng)或略有勝出,而 FP6 的性能則也達(dá)到了競品 2 倍以上。此外,在 FP4 運(yùn)算上,MI355X 與競品的峰值性能相近。而在性價比方面,另外相比 B200,采用 Instinct MI355X 的企業(yè)或開發(fā)者可獲得 40% Tokens/$ 性價比優(yōu)勢。
相較于上一代的 MI300X ,MI355X 運(yùn)行 Llama 3.1 405B 時,其智能體性能是前者的 4.2 倍,“內(nèi)容生成能力”是上一代( MI300X)的 2.9 倍,“摘要生成”能力是上一代( MI300X)的 3.8 倍,“對話式人工智能”性能表現(xiàn)則為上一代( MI300X)的 2.6 倍。
AMD Instinct MI350 系列構(gòu)建基于開放標(biāo)準(zhǔn)的機(jī)架級 AI 基礎(chǔ)設(shè)施,支持高密度擴(kuò)展與先進(jìn)網(wǎng)絡(luò)互聯(lián)。
AMD Instinct? MI350 系列平臺采用開放標(biāo)準(zhǔn)設(shè)計(jì),全面支持 UEC(Universal Baseboard for Edge Computing)與 OCP(Open Compute Project)規(guī)范,構(gòu)建面向下一代 AI 工作負(fù)載的高性能機(jī)架級基礎(chǔ)設(shè)施。該系列結(jié)合了 Instinct MI350 系列加速器與第五代 AMD EPYC? x86 處理器,支持多種規(guī)模配置選項(xiàng),包括搭載 128、96 或 64 顆 GPU 的系統(tǒng),分別集成高達(dá) 36TB、27TB 和 18TB 的 HBM3E 高帶寬內(nèi)存資源。平臺在 FP8、FP6 和 FP4 等多種精度下均具備卓越的 AI 運(yùn)算能力,可滿足大規(guī)模模型訓(xùn)練、推理與部署需求,特別適用于超大規(guī)模數(shù)據(jù)中心與云端 AI 集群的橫向擴(kuò)展。相關(guān)系統(tǒng)方案預(yù)計(jì)將于 2025 年第三季度起,通過 AMD 合作伙伴生態(tài)體系全面推出。
AMD 預(yù)告下一代 AI 機(jī)架架構(gòu)“Helios”,引領(lǐng)未來高性能計(jì)算基礎(chǔ)設(shè)施發(fā)展
在 Advancing AI 2025 活動上,AMD 預(yù)告了其下一代機(jī)架級 AI 系統(tǒng)架構(gòu)“Helios”,該架構(gòu)將集成多項(xiàng)先進(jìn)計(jì)算組件,進(jìn)一步拓展高性能 AI 基礎(chǔ)設(shè)施的邊界。Helios 架構(gòu)將采用即將發(fā)布的 AMD Instinct MI400 系列 GPU、基于“Zen 6”微架構(gòu)的 AMD EPYC “Venice”處理器,以及 AMD Pensando “Vulcano”智能網(wǎng)卡,構(gòu)建具備高帶寬、高互聯(lián)與高能效特性的開放式平臺,旨在滿足下一代大規(guī)模 AI 模型的訓(xùn)練與部署需求。
AMD 預(yù)覽下一代“Helios”機(jī)架級 AI 架構(gòu),搭載 Instinct MI400 加速器與 Zen 6 平臺,面向 2026 年全面部署、
與此同時,AMD 也向大家預(yù)覽了 Instinct MI400 系列加速器的核心規(guī)格,該系列預(yù)計(jì)將于 2026 年正式推出。MI400 將配備高達(dá) 432GB 的 HBM4 高帶寬顯存,實(shí)現(xiàn) 19.6 TB/s 的顯存帶寬與每卡 300 GB/s 的擴(kuò)展互聯(lián)帶寬。在 AI 運(yùn)算能力方面,MI400 系列提供高達(dá) 40 PFLOPS(FP4 精度)和 20 PFLOPS(FP8 精度)的峰值性能,進(jìn)一步鞏固 AMD 在生成式 AI 和高性能計(jì)算領(lǐng)域的技術(shù)領(lǐng)先地位,延續(xù) MI300X 與 MI325X 平臺在能效、規(guī)模與靈活性方面的優(yōu)勢。
全新 ROCm 7 發(fā)布!助力開發(fā)效率提升,加速 AI 應(yīng)用落地
在硬件產(chǎn)品穩(wěn)步發(fā)展的同時,最新版本的 AMD 開源 AI 軟件棧 ROCm 7 也受到了科技行業(yè)和開發(fā)者們的關(guān)注。全新的 ROCm 7 其旨在滿足生成式人工智能和高性能計(jì)算工作負(fù)載不斷增長的需求。并在整體功能與生態(tài)兼容性上實(shí)現(xiàn)全面增強(qiáng)。新版本帶來對主流行業(yè)標(biāo)準(zhǔn) AI 框架的更強(qiáng)支持,顯著擴(kuò)展硬件適配范圍,并引入全新開發(fā)工具鏈、驅(qū)動程序、API 與加速庫,進(jìn)一步優(yōu)化開發(fā)者體驗(yàn),加速 AI 應(yīng)用的開發(fā)、調(diào)試與部署流程。
AMD Developer Cloud 面向全球開發(fā)者全面開放,助力高效 AI 開發(fā)與無縫擴(kuò)展
最后,AMD 宣布將進(jìn)一步擴(kuò)大 AMD Developer Cloud 的可用性,面向全球開發(fā)者與開源社區(qū)開放訪問權(quán)限。該平臺專為快速、可擴(kuò)展的高性能 AI 開發(fā)而打造,提供完全托管的云端環(huán)境,集成豐富的開發(fā)工具與資源,支持用戶快速啟動 AI 項(xiàng)目并實(shí)現(xiàn)靈活擴(kuò)展,滿足從原型驗(yàn)證到大規(guī)模部署的全流程需求。通過 AMD Developer Cloud 搭配 ROCm? 7 軟件棧,AMD 正在持續(xù)降低 AI 計(jì)算門檻,加速創(chuàng)新落地。
6 月 13 日消息,AMD 在北京時間今日凌晨 00:30 舉辦了其年度人工智能直播活動 Advancing AI 2025,AMD 董事長兼首席執(zhí)行官蘇姿豐同其它高管以及 AI 生態(tài)系統(tǒng)合作伙伴、客戶、開發(fā)人員一起,共同討論了 AMD 的產(chǎn)品和軟件如何重塑 AI 和高性能計(jì)算(HPC)格局。
在本次大會上,AMD 展示了其全面的端到端集成人工智能平臺愿景,并推出了全新基于行業(yè)標(biāo)準(zhǔn)的開放、可擴(kuò)展的機(jī)架級人工智能基礎(chǔ)設(shè)施產(chǎn)品。
首先,AMD 推出了全新一代 Instinct MI350 系列 GPU,在生成式人工智能和高性能計(jì)算的性能、效率和可擴(kuò)展性方面得到全面提升。
Instinct MI350 系列包括 Instinct MI350X 和 MI355X GPU 及平臺,實(shí)現(xiàn)了每代 4 倍的 AI 計(jì)算能力提升和 35 倍的推理性能飛躍。
新的 GPU 基于 AMD CDNA 4 架構(gòu),3nm 制程工藝打造,集成了 1850 億個晶體管,支持 FP4 & FP6 新一代 AI 數(shù)據(jù)類型,可提供 288GB HBM3E 顯存,支持單 GPU 上運(yùn)行高達(dá) 520B 參數(shù)的 AI 模型,支持 UBB8 行業(yè)標(biāo)準(zhǔn) GPU 節(jié)點(diǎn),提供風(fēng)冷和直液冷兩種版本,可以幫助企業(yè)實(shí)現(xiàn)快速部署基礎(chǔ)設(shè)施。
AMD Instinct MI355X GPU 在 AI 和 HPC 領(lǐng)域性能有出色表現(xiàn),根據(jù) AMD 的介紹,在與 NVIDIA B200 和 GB200 的對比中:
在內(nèi)存容量方面,MI355X 約為競品的 1.6 倍,內(nèi)存帶寬則基本持平。
針對 FP64 和 FP32 運(yùn)算,MI355X 的峰值性能接近競品的兩倍。
對于 FP16 和 FP8 運(yùn)算,其峰值性能與競品相當(dāng)或略高,F(xiàn)P6 性能則達(dá)到 2 倍以上。
在 FP4 運(yùn)算上,MI355X 與競品的峰值性能相近,小幅領(lǐng)先。
另外相比 B200,使用 Instinct MI355X 可獲得 40% Tokens/$ 性價比提升。
而在和上一代 MI300X 的對比中,MI355X 運(yùn)行 Llama 3.1 405B 模型,在 AI 智能體性能表現(xiàn)上是前者的 4.2 倍,內(nèi)容生成能力是上一代 MI300X 的 2.9 倍,摘要能力是上一代的 3.8 倍,對話式人工智能表現(xiàn)則為 2.6 倍。
AMD 表示,Instinct MI350 系列超出了 AMD 設(shè)定的五年目標(biāo),即將 AI 訓(xùn)練和高性能計(jì)算節(jié)點(diǎn)的能效提高 30 倍,最終實(shí)現(xiàn)了 38 倍的提升。
AMD Instinct MI350 系列提供基于開放標(biāo)準(zhǔn)的機(jī)架基礎(chǔ)設(shè)施和網(wǎng)絡(luò)解決方案。
該系列產(chǎn)品支持 UEC、OCP 設(shè)計(jì),搭載 Instinct GPU 與第五代 EPYC x86 CPU,不同配置包括 128 顆 GPU、96 顆 GPU 和 64 顆 GPU,分別具備 36TB、27TB 和 18TB HBM3E 內(nèi)存,性能指標(biāo)涵蓋 FP8、FP6 和 FP4 精度,適用于大規(guī)模機(jī)架擴(kuò)展方案,預(yù)計(jì)從 Q3 開始通過 AMD 解決方案合作伙伴提供相關(guān)產(chǎn)品。
從活動獲悉,AMD 還預(yù)告了其下一代 AI 機(jī)架架構(gòu)“Helios”。它將基于下一代 AMD Instinct MI400 系列 GPU、基于“Zen 6”架構(gòu)的 AMD EPYC “Venice” CPU 以及 AMD Pensando “Vulcano”網(wǎng)卡構(gòu)建。
同時 AMD 更預(yù)告了 Instinct MI400 系列 GPU,預(yù)計(jì) 2026 年上市。該系列配備 432GB HBM4 顯存,帶寬達(dá) 19.6TB/s,每 GPU 擴(kuò)展帶寬為 300GB/s;提供 40PF FP4 和 20PF FP8 的 AI 計(jì)算性能,延續(xù) MI300X、MI325X 等系列優(yōu)勢。
AMD 還公布了一個新的 2030 年目標(biāo),即從 2024 年基準(zhǔn)年起,將機(jī)架級能效提高 20 倍,屆時,現(xiàn)在需要超過 275 個機(jī)架才能訓(xùn)練的典型 AI 模型,在 2030 年時僅需一個完全利用的機(jī)架即可完成訓(xùn)練,同時耗電量減少 95%。
此外最新版本的 AMD 開源 AI 軟件棧 ROCm 7 也受到了不少網(wǎng)友的關(guān)注,其旨在滿足生成式人工智能和高性能計(jì)算工作負(fù)載不斷增長的需求 —— 同時全面提升開發(fā)者體驗(yàn)。ROCm 7 具有改進(jìn)的行業(yè)標(biāo)準(zhǔn)框架支持、擴(kuò)展的硬件兼容性以及新的開發(fā)工具、驅(qū)動程序、API 和庫,以加速 AI 的開發(fā)和部署。
最后值得一提的是,AMD 將為面向全球開發(fā)者和開源社區(qū)的 AMD 開發(fā)者云帶來更廣泛的使用權(quán)限。該平臺專為快速、高性能的 AI 開發(fā)而構(gòu)建,用戶在 AMD 開發(fā)者云上將能夠訪問一個完全托管的云環(huán)境,包括擁有啟動 AI 項(xiàng)目所需的工具和靈活性,并能夠無限制擴(kuò)展。
本文鏈接:http://www.www897cc.com/showinfo-45-13810-0.htmlAMD Advancing AI 2025 大會如期而至:重磅發(fā)布 Instinct MI350 系列 GPU 產(chǎn)品,推理性能提升達(dá) 35 倍
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 面壁智能 MiniCPM 4 與 Intel 全面適配,實(shí)現(xiàn) AI PC 2.2 倍長文本推理優(yōu)化
下一篇: DeepSeek R1 推理性能提升 3.8 倍,AMD 發(fā)布下一代開源軟件棧技術(shù) ROCm 7