當前位置：首頁 > 科技 > 軟件

英偉達推「萬億參數」GPU，繼續加速「AGI 時代」

來源：責編：時間：2024-03-24 16:22:32 232觀看

導讀作者 | 宛辰、Li Yuan編輯| 靖宇「瘋球了，徹底瘋球了！」「這是什么？泰勒?斯威夫特的演唱會嗎？」當地時間 3 月 18 日中午，美國加州圣何塞 SAP 體育中心，超過萬人的冰球體育館內座無虛席。這是 2024 年英偉達的 GTC

作者 | 宛辰、Li Yuan

編輯| 靖宇

「瘋球了，徹底瘋球了！」

「這是什么？泰勒?斯威夫特的演唱會嗎？」

當地時間 3 月 18 日中午，美國加州圣何塞 SAP 體育中心，超過萬人的冰球體育館內座無虛席。

這是 2024 年英偉達的 GTC 大會現場，人們等待的并不是 1 米 80 的白人女星，而是一位身穿皮衣的亞裔中年男性 —— 英偉達創始人兼 CEO 黃仁勛。

15 個月內市值暴漲 6 倍至超過 2 萬億美元，成為繼蘋果和微軟之后的全球第三大科技公司，并且仍然看不到增長的天花板 —— 是的，從某種意義上看，黃仁勛可能比斯威夫特更像一個「搖滾巨星」。

時隔 5 年再度回歸線下的 GTC，現場爆滿。開場，老黃打趣道：「你要意識到，這不是一場演唱會，而是一個開發者大會」。面對「粉絲」的熱情歡呼，黃仁勛也不禁用調侃作為開場白。

很難想象能有一個會議容納如此多不同行業背景的人，從氣候技術到無線電科學、從機器人到自動駕駛、從 IT 業到非 IT 業。「坐在這個會場里的你我他，代表世界上 100 萬億美元的行業」。

而把如此多行業和英偉達締結聯系的，正是 AI。以大語言模型為核心的 AI 正在席卷幾乎所有行業，英偉達為各行各業的 AI 變革提供算力引擎。

兩萬億美元市值如何「坐實」、如何用算力繼續推送新一波的AI浪潮、更重要的是，英偉達如何成為「新計算時代」的王者？面對這些巨型問題，今年的這場 GTC 大會對于英偉達來說，尤其重要。

英偉達最新的 GPU 產品系列｜圖片來源：Nvidia

在長達 2 小時的開場演講中，黃仁勛介紹了當下爆火的 AI 背后，英偉達準備好的新引擎：新計算架構下的硬件、軟件、服務，點燃了一個加速生成式 AI 應用的新生態：

硬件上，新 Blackwell 架構 GPU 組成的 GB200「新核彈」，將提供 4 倍于 Hopper 的訓練性能，大模型參數達到了萬億級別。

軟件層面，NIM「數字盒子」，讓企業能更簡單的在英偉達平臺上定制大模型；Omniverse 將機器人、無人駕駛和數字孿生的訓練和應用融合在一個平臺之中。

從這次發布會，你可以看到英偉達一方面通過「新 AI 核彈」穩固自己「生成 AI 算力基建」的地位；另一方面通過 NIM、Omniverse 進一步擴大產業鏈下游，力求將自己的客戶 —— 大模型公司 —— 逐漸管道化；同時利用 Thor+ Omniverse 成為數字孿生、無人駕駛以及機器人等新興行業最重要的基礎平臺。

在發布預測天氣的 Earth-2 模型時，黃仁勛背后出現了一張地球的衛星圖片。「他的野心一直都是整個地球，無論是物理的，還是虛擬的。」喜歡瞎猜的人，可能會寫下這樣的圖注。

01. Blackwell，專為 Transformer 而生

過去 10 年，隨著 AI 的代際發展，英偉達提供所需算力的速度也在加快。

現在，生成式 AI 時代，英偉達計算平臺進入下一個周期 ——Blackwell。這一新架構是繼兩年前推出的 Hopper 架構以來的全新架構。

黃仁勛在臺上介紹新架構芯片的優勢時打趣道：「這是 Blackwell（左邊），這是 Hopper（右邊），Hopper 沒關系，你的表現也很好」。｜圖片來源：Nvidia

與之前的 Hopper GPU 一樣，Blackwell GPU 將作為獨立 GPU 提供，或者兩個 Blackwell GPU 可以組合并與英偉達的 Grace CPU 配對，創建一個超級芯片 GB200。

GB200 同過去架構的 AI 芯片性能對比｜圖片來源：Nvidia

作為一個超大規模的芯片，GB200 通過 900GB/s 超低功耗的片間互聯，將兩個 B200 GPU 與 Grace CPU 相連。

英偉達表示，該系統可以部署 27 萬億參數的模型。這甚至比最大的模型（例如 GPT-4）還要大得多，據報道 GPT-4 有 1.7 萬億個參數。

為了實現超高的 AI 性能，搭載 GB200 的系統可與英偉達 Quantum-X800 InfiniBand 和 Spectrum-X800 以太網平臺連接。這兩個平臺均可提供速度高達 800Gb / s 的高性能網絡。

黃仁勛手捧兩種 Blackwell 架構解決方案說「我得小心點，這個值多少錢，100 億美元？當然第二塊就便宜了，50 億吧。」｜圖片來源：Nvidia

DGX GB200 的數據性能爆表｜圖片來源：Nvidia

Nvidia 還發布了 GB200 NVL72 液冷機架系統，其中包含 36 顆 GB200 Grace Blackwell Superchips。Nvidia 表示，與當前的 H100 GPU 相比，該系統的推理工作負載性能提高了 30 倍。

作為英偉達在 AI 訓練和推理方面的新的頂級領導者，Blackwell GPU 和 GB200 超級芯片也將被引入云平臺 NVIDIA DGX B200 系統中，用以模型訓練、微調和推理。所有 NVIDIA DGX 平臺均包含用于企業級開發和部署的 NVIDIA AI Enterprise 軟件。

亞馬遜，谷歌、微軟和甲骨文將通過云服務出售 GB200 的訪問權限。

02. 定制大模型，更簡單

數據顯示，在這一波 AI 浪潮中，英偉達提供的 AI 算力可能達到了所有所需算力的 90% 甚至更高。而怎樣才能賣出更多算力？顯然是讓更多企業用上大模型。

企業想要使用大模型，通常需要進行微調和私有化部署，才能對自己的企業的業務有所助益。而在目前，通常通過部署模型的云廠商或者小的服務商完成。

此次發布會上，英偉達則推出了自己的模型定制服務，Nvidia Inference Manager，簡稱 NIM，來實現有英偉達硬件的地方，就可以進行簡單的調試使用大模型。

黃仁勛講解 NIM ｜圖片來源：Nvidia

NIM 被形容為一個數字盒子，在英偉達提供的網站下載即可使用。

盒子中包含幾個要件。首先是基礎大模型，有多種相關模型可供選擇，黃仁勛提到其中包括開源模型如 Llama，來自合作伙伴的模型，也包括英偉達自己創建的一些模型 —— 例如英偉達剛剛在 GTC 公布了一個新的天氣預測模型。

按照英偉達的說法，它們都是根據英偉達硬件已經優化好的，無論你的硬件是筆記本電腦這樣只有一塊 CPU 的，還是公司級別有多個 GPU 節點的，都可以直接使用。

第二是可以幫助用戶微調大模型的工具，這包含多項微服務。

比如，英偉達 2023 年 11 月宣布的 NVIDIA NeMo Retriever 技術，就被集成在整個的微服務中，可以幫助企業啟用 RAG 功能 —— 簡單來說就是幫助企業更好地使用自己的專有數據。

黃仁勛在演講中舉例子道：只下載了 Llama 2 模型時，他向 Llama2 提問公司獨有的編程語言方面的問題，Llama 2 無法很好地回答。而將公司的私有數據提供給大模型之后，大模型不但能回答出這個問題了，還能夠使用公司獨有的編程語言進行編程了。

學習過公司數據的大模型可以很好地幫助企業提高效率｜圖片來源：Nvidia

除了 RAG 增強，還有一系列的微服務可以幫助用戶使用大模型。包括 Lemo 檢索器，幫助信息的快速檢索，數字人的微服務，幫助用戶創建數字人等等。都包含在微服務中。

「未來我們將怎么構筑軟件？應該不是一行行地寫代碼。」黃仁勛講到，「很有可能是一個超級 AI 將任務分解，再交給一個一個的 NIM 去做。」

這樣的 NIM，則可以被安裝在任何英偉達硬件適配的地方。比如英偉達的 DGX 系統上，任何云上、企業私有的數據中心、或者是個人的硬件上。黃仁勛直接在演講中說道：「我們是 AI 鑄造廠。」

這項微服務，現在開發者可以免費試用。而企業則需要在企業軟件訂閱中，之前有消息稱，每個 GPU 每年收取費用 4500 美元。

03.「現實 AI」：數字倉庫和機器人

在推進算力和算力的使用上，英偉達是認真的。英偉達在二十年前就做出了 CUDA，推崇加速計算，今日的碩果累累來自于二十年前種下的因。

黃仁勛開場時回顧二十年前，半開玩笑地講到：「當時我們已經算到了有今日。」

而黃仁勛看到的未來是什么樣的呢？

在今天的 GTC 上，我們也小小地瞥見了一下黃仁勛眼中的未來：在世界的底層，是無限擴展的、不竭的算力，在中層，是數字孿生，是 simulation，是依靠算力帶來的對物理世界的無限精準的模仿，實驗和預測，而在上層，則是一個依靠算力達到最優解的世界 —— 在這個世界里，人與機器人共生。一切第一次發生的，都是發生過無數次的。

這其中，英偉達 2021 年開始推出的 Omniverse，就是中間層非常重要的工具。

Omniverse 是英偉達擅長的計算機圖形、人工智能、科技計算和物理模擬真正大一統的平臺，能夠對環境實現 1:1 的數字孿生。

此次發布會，結合人工智能的浪潮，Omniverse 展現了許多新的應用可能。

Omniverse 可以為現在最火的具身智能，提供一個訓練場所。英偉達表示，英偉達建立了 Isaac Lab，一款機器人學習應用程序，用于在 Omniverse Isaac 模擬器上進行訓練。通過新的計算編排服務，可以在基于物理的模擬中訓練機器人，并能零次訓練（zero-shot）遷移到實際環境。

機器人模型將使機器人能夠從少量人類演示中學習，從視頻中理解人類、在模擬中訓練模型，并最終直接部署到物理機器人上。

黃仁勛還在發布會上宣布了 ProjectGR00T 項目，GR00T 是一個用于人形機器人的通用基礎模型，基于 Jetson Thor（英偉達的一款 GPU）來開發生產機器人。

黃仁勛與人形機器人「站在一起」，其中部分機器人來自中國公司｜圖片來源：Nvidia

除此之外，英偉達還展示了一個數字倉庫的案例。

數字倉庫感知和規劃了人和機器人的路線｜圖片來源：Nvidia

視頻中，展示了一個一個 10 萬平方英尺倉庫的 Omniverse 模擬環境，它整合了運行視頻、Isaac 感知器堆棧的數字工人 AMR、來自 100 個模擬天花板安裝攝像頭的整個倉庫的集中活動地圖等。

在視頻中，一個數字工人 AMR 的原定計劃的路線上，發生了一起事故，路徑受阻。英偉達 Metropolis 可以實時改變路徑規劃。通過基于生成式 AI 的 Metropolis 視覺基礎模型，操作員甚至可以使用自然語言提問發生了什么事情。

在此次 GTC 上，英偉達宣布，將創建 Omniverse Cloud 的 api，而且將非常易用，企業可以更容易地使用 Omniverse，同時其中還將有 AI 的能力。比如可以直接用自然語言場景描述，創建仿真環境的 3D 圖像。

同時，英偉達宣布與 Vision Pro 達成合作，Omniverse Cloud 將能夠向 Vision Pro 串流。「從虛擬車上下來，穿過車門的感覺，非常奇怪，但也非常棒。」黃仁勛講到，「Vision Pro 將把你帶入 Omniverse Cloud，你能夠體驗到的工作流是無與倫比的。」

超過 1 萬人在現場觀看 Keynote，900 場以上的分享以及數百家展商，2024 年 GTC 被戲稱為「AI 界的伍德斯托克」—— 除了蘋果公司，少有公司能讓科技變成一種人人想要「沾上邊」的時尚。畢竟，在「生成式 AI」代表未來的當下，每個人都想成為那個跟上潮流的人。

英偉達無疑是那個潮流背后最大的推手之一，同時也是目前最大的受益方，它需要做的，是為所有人提供更大的夢想，和更多的算力。順便，或許，成為全球市值最高的公司，沒有之一。

本文來自微信公眾號：極客公園（ID：geekpark），作者：宛辰、Li Yuan

本文鏈接：http://www.www897cc.com/showinfo-26-78869-0.html英偉達推「萬億參數」GPU，繼續加速「AGI 時代」

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：又一場“宮斗戲”？Stability AI 首席執行官辭職，要專注開發去中心化 AI

下一篇：滴滴 2023 年全年實現總收入 1924 億元，同比增長 36.6%

標簽：

熱門焦點

MIX Fold3包裝盒泄露新機本月登場

小米的全新折疊屏旗艦MIX Fold3將于本月發布，近日該機的真機包裝盒在網上泄露。從圖上來看，新的MIX Fold3包裝盒在外觀設計方面延續了之前的方案，變化不大，這也是目前小米旗艦
6月iOS設備好評榜：第一蟬聯榜首近一年

作為安兔兔各種榜單里變化最小的那個，2023年6月的iOS好評榜和上個月相比沒有任何排名上的變化，僅僅是部分設備好評率的下降，長年累月的用戶評價和逐漸退出市場的老款機器讓這
微軟邀請 Microsoft 365 商業用戶，測試視頻編輯器 Clipchamp

8 月 1 日消息，微軟近日宣布即將面向 Microsoft 365 商業用戶，開放 Clipchamp 應用，邀請用戶通過該應用來編輯視頻。微軟于 2021 年收購 Clipchamp，隨后開始逐步整合到 Microsof
Temu起訴SHEIN，跨境電商戰事升級

來源 | 伯虎財經（bohuFN）作者 | 陳平安日前據外媒報道，拼多多旗下跨境電商平臺Temu正對競爭對手SHEIN提起新訴訟，訴狀稱Shein“利用市場支配力量強迫服裝廠商與之簽訂獨家
品牌洞察丨服務本地，美團直播成效幾何？

來源：17PR7月11日，美團App首頁推薦位出現“美團直播”的固定入口。在直播聚合頁面，外賣“神槍手”直播間、美團旅行直播間、美團買菜直播間等均已上線，同時
華為開發者大會2023日程公開：開設鴻蒙HarmonyOS 4體驗區

IT之家 7 月 31 日消息，華為今日公布了 HDC.Together 開發者大會 2023 的詳細日程。整場大會將于 8 月 4 日-6 日之間舉行，屆時將發布最新一代鴻蒙 H
2納米決戰2025

集微網報道從三強爭霸到四雄逐鹿，2nm的廝殺聲已然隱約傳來。無論是老牌勁旅臺積電、三星，還是誓言重回先進制程領先地位的英特爾，甚至初成立不久的新
OPPO Reno10 Pro英雄聯盟定制禮盒公布：薩勒芬妮同款配色夢幻十足

5月24日，OPPO推出了全新的OPPO Reno 10系列，包含OPPO Reno10、OPPO Reno10 Pro和OPPO Reno10 Pro+三款新機，全系標配了超光影長焦鏡頭，是迄今為止拍照
“買真退假” 這種“羊毛”不能薅

□ 法治日報記者王春　　□ 本報通訊員胡佳麗　　2020年初，還在上大學的小東加入了一個大學生兼職QQ群。群主“七王”在群里介紹一些刷單賺

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

英偉達推「萬億參數」GPU，繼續加速「AGI 時代」

MIX Fold3包裝盒泄露新機本月登場

6月iOS設備好評榜：第一蟬聯榜首近一年

微軟邀請 Microsoft 365 商業用戶，測試視頻編輯器 Clipchamp

Temu起訴SHEIN，跨境電商戰事升級

品牌洞察丨服務本地，美團直播成效幾何？

華為開發者大會2023日程公開：開設鴻蒙HarmonyOS 4體驗區

2納米決戰2025

OPPO Reno10 Pro英雄聯盟定制禮盒公布：薩勒芬妮同款配色夢幻十足

“買真退假” 這種“羊毛”不能薅

最新推薦

猜你喜歡

熱門推薦

相關資訊