日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 汽車 > 新車

英偉達(dá)Blackwell DGX系統(tǒng)刷新DeepSeek推理性能世界紀(jì)錄

來源: 責(zé)編: 時間:2025-03-19 09:40:58 189觀看
導(dǎo)讀英偉達(dá)在NVIDIA GTC 2025大會上宣布,其最新推出的NVIDIA Blackwell DGX系統(tǒng)在DeepSeek-R1大模型推理性能上創(chuàng)造了世界紀(jì)錄。這一突破性進(jìn)展標(biāo)志著英偉達(dá)在人工智能推理技術(shù)上的又一次飛躍。據(jù)悉,在單個搭載八塊Blackwel

英偉達(dá)在NVIDIA GTC 2025大會上宣布,其最新推出的NVIDIA Blackwell DGX系統(tǒng)在DeepSeek-R1大模型推理性能上創(chuàng)造了世界紀(jì)錄。這一突破性進(jìn)展標(biāo)志著英偉達(dá)在人工智能推理技術(shù)上的又一次飛躍。q4o28資訊網(wǎng)——每日最新資訊28at.com

據(jù)悉,在單個搭載八塊Blackwell GPU的DGX系統(tǒng)上,DeepSeek-R1模型以6710億參數(shù)的滿血狀態(tài)運(yùn)行,實(shí)現(xiàn)了每用戶每秒超過250 token的響應(yīng)速度,系統(tǒng)整體吞吐量更是突破了每秒3萬token的大關(guān)。這一數(shù)據(jù)不僅彰顯了Blackwell GPU的強(qiáng)大性能,也展示了英偉達(dá)在優(yōu)化大型語言模型推理方面的深厚實(shí)力。q4o28資訊網(wǎng)——每日最新資訊28at.com

q4o28資訊網(wǎng)——每日最新資訊28at.com

英偉達(dá)強(qiáng)調(diào),隨著Blackwell Ultra GPU和Blackwell GPU的不斷升級,NVIDIA平臺將繼續(xù)在推理性能上實(shí)現(xiàn)新的突破。這一承諾不僅體現(xiàn)在硬件上,還體現(xiàn)在軟件優(yōu)化上。英偉達(dá)通過結(jié)合硬件和軟件的力量,自2025年1月以來,成功將DeepSeek-R1 671B模型的吞吐量提高了約36倍。q4o28資訊網(wǎng)——每日最新資訊28at.com

在會上,英偉達(dá)還展示了不同配置下的DGX系統(tǒng)性能。包括DGX B200(8塊GPU)和DGX H200(8塊GPU)在內(nèi)的單節(jié)點(diǎn)配置,在采用TensorRT-LLM軟件的最新內(nèi)部版本進(jìn)行測試時,展現(xiàn)了出色的推理性能。測試參數(shù)包括輸入1024 token和輸出2048 token,并發(fā)性達(dá)到最大。在計(jì)算精度上,B200采用了FP4精度,而H200則采用了FP8精度。q4o28資訊網(wǎng)——每日最新資訊28at.com

q4o28資訊網(wǎng)——每日最新資訊28at.com

英偉達(dá)還對比了Blackwell架構(gòu)與Hopper架構(gòu)在推理性能上的差異。結(jié)果顯示,Blackwell架構(gòu)與TensorRT軟件相結(jié)合,可以顯著提升推理性能。在DeepSeek-R1、Llama 3.1 405B和Llama 3.3 70B等模型上,使用FP4精度的DGX B200平臺和DGX H200平臺相比,推理吞吐量提高了3倍以上。q4o28資訊網(wǎng)——每日最新資訊28at.com

q4o28資訊網(wǎng)——每日最新資訊28at.com

英偉達(dá)還展示了不同數(shù)據(jù)集上DeepSeek-R1模型的精度表現(xiàn)。在FP4和FP8精度下,DeepSeek-R1模型在MMLUG、SM8K、AIME 2024、GPQA和DiamondMATH-500等數(shù)據(jù)集上的表現(xiàn)均十分出色。值得注意的是,在使用TensorRT Model Optimizer的FP4訓(xùn)練后量化(PTQ)技術(shù)時,DeepSeek-R1模型在不同數(shù)據(jù)集上的精度損失微乎其微,這進(jìn)一步證明了英偉達(dá)在量化技術(shù)上的領(lǐng)先地位。q4o28資訊網(wǎng)——每日最新資訊28at.com

q4o28資訊網(wǎng)——每日最新資訊28at.com

英偉達(dá)表示,在對模型進(jìn)行量化以利用低精度計(jì)算優(yōu)勢時,確保精度損失最小化是生產(chǎn)部署的關(guān)鍵。通過不斷的技術(shù)創(chuàng)新和優(yōu)化,英偉達(dá)將繼續(xù)為客戶提供更高效、更準(zhǔn)確的AI推理解決方案。q4o28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-48-5974-0.html英偉達(dá)Blackwell DGX系統(tǒng)刷新DeepSeek推理性能世界紀(jì)錄

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 英偉達(dá)GTC 2025:DeepSeek-R1刷新推理性能世界紀(jì)錄

下一篇: 滴滴2024年業(yè)績亮眼:全年交易量破160億單,國際業(yè)務(wù)增長近36%!

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 主站蜘蛛池模板: 垫江县| 多伦县| 甘肃省| 南宫市| 海淀区| 铁岭市| 江口县| 茌平县| 泾阳县| 兴仁县| 郁南县| 尼玛县| 偃师市| 河西区| 康乐县| 曲阳县| 民丰县| 陇西县| 新竹市| 兰西县| 库尔勒市| 屯昌县| 淮北市| 且末县| 河曲县| 吴旗县| 万宁市| 台北市| 顺义区| 新巴尔虎左旗| 新化县| 思南县| 航空| 光泽县| 山西省| 宜宾市| 彰武县| 宣武区| 怀柔区| 邻水| 彭山县|