AI,這個在2023年猶如井泉噴涌進我們日常生活的詞語,現如今正以驚人的速度重塑著我們的生活方式,同時間改變著整個世界的面貌。從大語言LLMs模型到先進的AI圖像生成,從智能算法推薦到驚人的AI視頻生成,人工智能的觸角已經伸展到了科技的各個角落。
從GPT-4發布,到谷歌Bard的入場、Meta開源模型LLama的問世,再到國內文心一言、星火大模型、通義千問、月之暗面等諸多國產模型的紛紛亮相。我們目睹了全球人工智能領域的快速發展和技術突破。
如今AI的競爭依然處于百花齊放百家爭鳴的階段,每一家都在使用自身優勢在AI浪潮中分得一杯羹。從北美的硅谷到歐洲的科技集群,從亞洲的研發中心到其他地區的創新孵化器,AI正在成為跨國界、跨文化的合作與競爭的焦點。
若將人工智能比作科技高峰上的璀璨之花,那么NVIDIA無疑是這些花朵賴以綻放的肥沃土壤。正是NVIDIA提供的先進計算平臺,成為滋養人工智能之林的關鍵養分,讓這些技術之花競相開放,展現出驚世之美。
2024 NVIDIA GTC主題演講 見證 AI 的變革時刻
每年春季,NVIDIA的GTC主題演講就如約而至。自2019年以“GPU Computing: The Future of Computing”揭開序幕,AI便成了GTC年會的重頭戲。NVIDIA始終致力于將旗下產品的強大算力與AI技術的前沿需求無縫對接。正是老黃遠見卓識的策略布局,使NVIDIA在AI的黃金時代巍然屹立,穩占行業霸主之位。
2023年,老黃在演講中詳細闡述了NVIDIA在人工智能、數據中心、云計算等關鍵領域取得的新成果。
重點介紹了NVIDIA Hopper GPU架構,它使AI性能相比前一代產品實現了翻倍的飛躍。同時,NVIDIA DGX Cloud為企業級用戶帶來了前所未有的強大算力支持。
而NVIDIA Omniverse平臺則將AI技術的應用拓展到了設計和建筑行業。老黃在演講中富有預見性地指出:我們現在正處在人工智能的‘iPhone時代’。
那么在今天的GTC大會上,老黃,這位“人類AI教父”又給我們帶來了什么新鮮事呢?
Blackwell 2080億晶體管的算力猛獸
當下,世界范圍內使用多的AI應用-LLMs,如Google的Gemini、Meta的NLLB、Maxtral的Mistral以及OpenAI的GPT-4等模型,均采用了“專家混合”(Mixtures of Experts,MoEs)技術。這些模型功能的強大,對芯片硬件提出了更高的要求。2023年,NVIDIA 憑借其Hopper架構,成功地迎接了這些挑戰。
在今年的GTC上,老黃再一次地刷新了世界AI商用算力的排行榜,發布了Blackwell 架構和同名AI處理器B100、B200和GB200,產品取名自杰出數學家和統計學家 David H. Blackwell,體現了其在概率計算、博弈論、統計學和動態規劃等多個領域的杰出貢獻。
此次發布的 Blackwell GPU B100使用了兩個臺積電4NP工藝制造的芯片,芯片面積為814平方毫米,這個數據已經接近了EUV光刻技術的理論極限值(858平方毫米),兩個芯片通過C2C-Interface進行相連,組成一個“1600平方毫米”的超大處理單元。
單個GPU芯片含1040億晶體管,整體達到2080億個,比上一代的Hopper架構增加了240億個。每個GPU連接了四個各有24GB的HBM3E存儲芯片,使得B100 AI處理器擁有192GB的高速存儲,并且存儲帶寬達到了8TB/s。
B100/B200/H100/AMDMI300X AI處理器重點參數對比 圖片源自于網絡
在計算性能方面,NVIDIA 目前主要公布了 Blackwell 架構中 Tensor Cores 的性能數據。對比 NVIDIA Hopper架構的數據顯示,對于低精度計算,Blackwell GPU 的性能是前代的2.5倍。
而針對 FP64 計算,性能從 67 TFLOPS 降低至 30 TFLOPS。對此,NVIDIA并沒有進行解釋,許多博主也對FP64精度計算性能的下降表示了疑惑。
在日常的計算任務中,FP32(單精度浮點數)和FP64是為普遍的數據格式,它們使用32位和64位分別對浮點數進行編碼,既能提供較大的數值范圍也保障了較高的數值精度,但相對地,也對內存和計算資源的需求更高。
與之相對,FP16(半精度浮點數)和FP4提供的算力精度較低,特別是FP4,其低精度下的性能并不理想,即使在大型語言模型(LLMs)中開啟FP4精度運行也是如此。
尚不明確NVIDIA此次為何將主要升級焦點放在FP4運算上。隨著針對移動端LLMs需求的增長,對FP4運算的依賴可能有所增加,這或許促使NVIDIA優化了對FP4的支持,以提升這些應用的運算效率。
功耗方面,NVIDIA 宣布 Blackwell 系列的TDP范圍在 700 至 1200 W之間。其中,風冷版本的 B100 和 B200 的 TDP 分別為 700W和 1000 W,而 1200 W版本的則需使用上水冷散熱。此外,Blackwell GPU 還配備了支持 6.0 標準的 PCI-Express 控制器。
然后也放一下B100和B200的對比圖,B200在運算性能與顯存上對比B100有了不小的提升,相當于B100的“官方灰燼版”。同時NVIDIA還推出了GB200。
GB200就是將2個B200芯片和1個GraceCPU整合到一起,“合體之后”的性能表現將是單片H100的30倍左右的提升。當然GB200是應該是不會單獨售賣的,如同去年推出的HGX 100 72X一樣,GB200主要還是通過整合,然后形成一個GB200 NVL72的計算中心進行出售。
回顧近發布的Blackwell GPU,我認為其大亮點并非在于算力的顯著提升,而是它所搭載的192GB HBM 3E高帶寬存儲。面對如今日益增長的模型尺寸——例如,埃隆·馬斯克近宣布開源的Grok-1模型,它至少需要800GB的顯存才能運行。
若使用H100 GPU(配備80GB顯存),運行該模型需要整整10張卡,而采用B100 GPU(如果每張配備192GB顯存),僅需4張便可滿足需求。這對于運維商而言,無疑是一種成本效率極高的解決方案。
這也是未來AI處理器發展的一個趨勢,為了更好地AMD 的 Instinct MI300 系列產品形成壓制。NVIDIA 還計劃在今年下半年為 H100 系列加速器增加新的 H200 或 GH200 代,這將提供更高的 141 GB HBM3E 存儲以及 4.8 TB/s 的存儲帶寬,也就是官方的顯存提升版本。
Omniverse 再升級,Vision Pro應用新場景?
NVIDIA在本次的GTC 2024中進一步升級了其Omniverse平臺,并將其企業技術擴展到了蘋果生態系統。這一策略在于借助Vision Pro應用,使開發者得以在增強現實/虛擬現實(AR/VR)環境中利用Omniverse的強大工具。
在GTC大會上上,NVIDIA展示了設計師如何利用Vision Pro中的汽車配置工具操作車輛模型,并能夠以虛擬的方式“進入”車輛內部進行查看。這種交互是通過Omniverse Cloud API實現的,此外,圖形內容還可以通過云計算服務直接流式傳輸至Vision Pro,實現高效的圖形傳輸網絡服務。
這一升級意味著,Omniverse和Vision Pro的結合將為AR/VR領域帶來更加沉浸式和互動性強的體驗。用戶能夠在三維空間中以更加自然和直觀的方式進行設計、模擬和創作,這對于產品設計、建筑可視化以及互動娛樂等多個應用場景都將是一次質的飛躍。
機器人的ChatGPT時代可能即將來臨
正當我們以為今天的大會只會聚焦于算力話題時,老黃卻給我們帶來了意想不到的驚喜——備受矚目的年度機器人環節如約而至,NVIDIA宣布了其人形機器人項目GR00T。
在今日的主題演講中,黃仁勛展示了多款由GR00T平臺驅動的人形機器人如何高效完成多項任務,這些機器人分別來自 Agility Robotics、Apptronik、傅利葉智能以及宇樹科技。
GR00T的誕生源自NVIDIA的Isaac機器人平臺工具,它基于全新的通用基礎模型設計,使得GR00T驅動的人形機器人能夠接收并處理文本、語音、視頻乃至現場示范的輸入信息,從而執行精確的操作。這些操作包括理解自然語言、模仿人類行為、在現實世界中的導航和互動等。可以說,AI已經變成了機器人的“靈魂”。
NVIDIA還開發了一款新型的“機器人大腦”計算芯片——Jetson Thor,該芯片能夠執行復雜的任務,并借助Transformer引擎處理多元的傳感器數據。
未來,NVIDIA將人形機器人定位為公司的一個關鍵戰略方向。正如黃仁勛所預示的,機器人界的ChatGPT時代可能即將來臨。
在過去,NVIDIA給人更多的印象就是一個游戲顯卡的制造商,很少有人能夠想到在不到20年的時間里,NVIDIA通過CUDA能夠讓GPU從一個“游戲硬件”概念變成一個改變世界的“數字石油”。
未來,隨著技術的不斷進步,NVIDIA的GPU很可能繼續拓展其影響力。隨著量子計算、邊緣計算和物聯網的發展,NVIDIA的技術有望在新的領域中發揮關鍵作用,進一步加速世界的數字化轉型。
本文鏈接:http://www.www897cc.com/showinfo-24-78351-0.html回顧NVIDIA GTC 2024:Blackwell算力核彈問世
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: SSD等漲價25%只是開始!三星工廠突然大火:存儲價格又要漲了
下一篇: PC市場強勢復蘇:今年將重回增長軌道