作者 | 宛辰、Li Yuan
編輯| 靖宇
「瘋球了,徹底瘋球了!」
「這是什么?泰勒?斯威夫特的演唱會(huì)嗎?」
當(dāng)?shù)貢r(shí)間 3 月 18 日中午,美國(guó)加州圣何塞 SAP 體育中心,超過(guò)萬(wàn)人的冰球體育館內(nèi)座無(wú)虛席。
這是 2024 年英偉達(dá)的 GTC 大會(huì)現(xiàn)場(chǎng),人們等待的并不是 1 米 80 的白人女星,而是一位身穿皮衣的亞裔中年男性 —— 英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛。
15 個(gè)月內(nèi)市值暴漲 6 倍至超過(guò) 2 萬(wàn)億美元,成為繼蘋果和微軟之后的全球第三大科技公司,并且仍然看不到增長(zhǎng)的天花板 —— 是的,從某種意義上看,黃仁勛可能比斯威夫特更像一個(gè)「搖滾巨星」。
時(shí)隔 5 年再度回歸線下的 GTC,現(xiàn)場(chǎng)爆滿。開場(chǎng),老黃打趣道:「你要意識(shí)到,這不是一場(chǎng)演唱會(huì),而是一個(gè)開發(fā)者大會(huì)」。面對(duì)「粉絲」的熱情歡呼,黃仁勛也不禁用調(diào)侃作為開場(chǎng)白。
很難想象能有一個(gè)會(huì)議容納如此多不同行業(yè)背景的人,從氣候技術(shù)到無(wú)線電科學(xué)、從機(jī)器人到自動(dòng)駕駛、從 IT 業(yè)到非 IT 業(yè)。「坐在這個(gè)會(huì)場(chǎng)里的你我他,代表世界上 100 萬(wàn)億美元的行業(yè)」。
而把如此多行業(yè)和英偉達(dá)締結(jié)聯(lián)系的,正是 AI。以大語(yǔ)言模型為核心的 AI 正在席卷幾乎所有行業(yè),英偉達(dá)為各行各業(yè)的 AI 變革提供算力引擎。
兩萬(wàn)億美元市值如何「坐實(shí)」、如何用算力繼續(xù)推送新一波的AI浪潮、更重要的是,英偉達(dá)如何成為「新計(jì)算時(shí)代」的王者?面對(duì)這些巨型問(wèn)題,今年的這場(chǎng) GTC 大會(huì)對(duì)于英偉達(dá)來(lái)說(shuō),尤其重要。
在長(zhǎng)達(dá) 2 小時(shí)的開場(chǎng)演講中,黃仁勛介紹了當(dāng)下爆火的 AI 背后,英偉達(dá)準(zhǔn)備好的新引擎:新計(jì)算架構(gòu)下的硬件、軟件、服務(wù),點(diǎn)燃了一個(gè)加速生成式 AI 應(yīng)用的新生態(tài):
硬件上,新 Blackwell 架構(gòu) GPU 組成的 GB200「新核彈」,將提供 4 倍于 Hopper 的訓(xùn)練性能,大模型參數(shù)達(dá)到了萬(wàn)億級(jí)別。
軟件層面,NIM「數(shù)字盒子」,讓企業(yè)能更簡(jiǎn)單的在英偉達(dá)平臺(tái)上定制大模型;Omniverse 將機(jī)器人、無(wú)人駕駛和數(shù)字孿生的訓(xùn)練和應(yīng)用融合在一個(gè)平臺(tái)之中。
從這次發(fā)布會(huì),你可以看到英偉達(dá)一方面通過(guò)「新 AI 核彈」穩(wěn)固自己「生成 AI 算力基建」的地位;另一方面通過(guò) NIM、Omniverse 進(jìn)一步擴(kuò)大產(chǎn)業(yè)鏈下游,力求將自己的客戶 —— 大模型公司 —— 逐漸管道化;同時(shí)利用 Thor+ Omniverse 成為數(shù)字孿生、無(wú)人駕駛以及機(jī)器人等新興行業(yè)最重要的基礎(chǔ)平臺(tái)。
在發(fā)布預(yù)測(cè)天氣的 Earth-2 模型時(shí),黃仁勛背后出現(xiàn)了一張地球的衛(wèi)星圖片?!杆囊靶囊恢倍际钦麄€(gè)地球,無(wú)論是物理的,還是虛擬的?!瓜矚g瞎猜的人,可能會(huì)寫下這樣的圖注。
01. Blackwell,專為 Transformer 而生過(guò)去 10 年,隨著 AI 的代際發(fā)展,英偉達(dá)提供所需算力的速度也在加快。
現(xiàn)在,生成式 AI 時(shí)代,英偉達(dá)計(jì)算平臺(tái)進(jìn)入下一個(gè)周期 ——Blackwell。這一新架構(gòu)是繼兩年前推出的 Hopper 架構(gòu)以來(lái)的全新架構(gòu)。
與之前的 Hopper GPU 一樣,Blackwell GPU 將作為獨(dú)立 GPU 提供,或者兩個(gè) Blackwell GPU 可以組合并與英偉達(dá)的 Grace CPU 配對(duì),創(chuàng)建一個(gè)超級(jí)芯片 GB200。
作為一個(gè)超大規(guī)模的芯片,GB200 通過(guò) 900GB/s 超低功耗的片間互聯(lián),將兩個(gè) B200 GPU 與 Grace CPU 相連。
英偉達(dá)表示,該系統(tǒng)可以部署 27 萬(wàn)億參數(shù)的模型。這甚至比最大的模型(例如 GPT-4)還要大得多,據(jù)報(bào)道 GPT-4 有 1.7 萬(wàn)億個(gè)參數(shù)。
為了實(shí)現(xiàn)超高的 AI 性能,搭載 GB200 的系統(tǒng)可與英偉達(dá) Quantum-X800 InfiniBand 和 Spectrum-X800 以太網(wǎng)平臺(tái)連接。這兩個(gè)平臺(tái)均可提供速度高達(dá) 800Gb / s 的高性能網(wǎng)絡(luò)。
Nvidia 還發(fā)布了 GB200 NVL72 液冷機(jī)架系統(tǒng),其中包含 36 顆 GB200 Grace Blackwell Superchips。Nvidia 表示,與當(dāng)前的 H100 GPU 相比,該系統(tǒng)的推理工作負(fù)載性能提高了 30 倍。
作為英偉達(dá)在 AI 訓(xùn)練和推理方面的新的頂級(jí)領(lǐng)導(dǎo)者,Blackwell GPU 和 GB200 超級(jí)芯片也將被引入云平臺(tái) NVIDIA DGX B200 系統(tǒng)中,用以模型訓(xùn)練、微調(diào)和推理。所有 NVIDIA DGX 平臺(tái)均包含用于企業(yè)級(jí)開發(fā)和部署的 NVIDIA AI Enterprise 軟件。
亞馬遜,谷歌、微軟和甲骨文將通過(guò)云服務(wù)出售 GB200 的訪問(wèn)權(quán)限。
02. 定制大模型,更簡(jiǎn)單數(shù)據(jù)顯示,在這一波 AI 浪潮中,英偉達(dá)提供的 AI 算力可能達(dá)到了所有所需算力的 90% 甚至更高。而怎樣才能賣出更多算力?顯然是讓更多企業(yè)用上大模型。
企業(yè)想要使用大模型,通常需要進(jìn)行微調(diào)和私有化部署,才能對(duì)自己的企業(yè)的業(yè)務(wù)有所助益。而在目前,通常通過(guò)部署模型的云廠商或者小的服務(wù)商完成。
此次發(fā)布會(huì)上,英偉達(dá)則推出了自己的模型定制服務(wù),Nvidia Inference Manager,簡(jiǎn)稱 NIM,來(lái)實(shí)現(xiàn)有英偉達(dá)硬件的地方,就可以進(jìn)行簡(jiǎn)單的調(diào)試使用大模型。
NIM 被形容為一個(gè)數(shù)字盒子,在英偉達(dá)提供的網(wǎng)站下載即可使用。
盒子中包含幾個(gè)要件。首先是基礎(chǔ)大模型,有多種相關(guān)模型可供選擇,黃仁勛提到其中包括開源模型如 Llama,來(lái)自合作伙伴的模型,也包括英偉達(dá)自己創(chuàng)建的一些模型 —— 例如英偉達(dá)剛剛在 GTC 公布了一個(gè)新的天氣預(yù)測(cè)模型。
按照英偉達(dá)的說(shuō)法,它們都是根據(jù)英偉達(dá)硬件已經(jīng)優(yōu)化好的,無(wú)論你的硬件是筆記本電腦這樣只有一塊 CPU 的,還是公司級(jí)別有多個(gè) GPU 節(jié)點(diǎn)的,都可以直接使用。
第二是可以幫助用戶微調(diào)大模型的工具,這包含多項(xiàng)微服務(wù)。
比如,英偉達(dá) 2023 年 11 月宣布的 NVIDIA NeMo Retriever 技術(shù),就被集成在整個(gè)的微服務(wù)中,可以幫助企業(yè)啟用 RAG 功能 —— 簡(jiǎn)單來(lái)說(shuō)就是幫助企業(yè)更好地使用自己的專有數(shù)據(jù)。
黃仁勛在演講中舉例子道:只下載了 Llama 2 模型時(shí),他向 Llama2 提問(wèn)公司獨(dú)有的編程語(yǔ)言方面的問(wèn)題,Llama 2 無(wú)法很好地回答。而將公司的私有數(shù)據(jù)提供給大模型之后,大模型不但能回答出這個(gè)問(wèn)題了,還能夠使用公司獨(dú)有的編程語(yǔ)言進(jìn)行編程了。
除了 RAG 增強(qiáng),還有一系列的微服務(wù)可以幫助用戶使用大模型。包括 Lemo 檢索器,幫助信息的快速檢索,數(shù)字人的微服務(wù),幫助用戶創(chuàng)建數(shù)字人等等。都包含在微服務(wù)中。
「未來(lái)我們將怎么構(gòu)筑軟件?應(yīng)該不是一行行地寫代碼。」黃仁勛講到,「很有可能是一個(gè)超級(jí) AI 將任務(wù)分解,再交給一個(gè)一個(gè)的 NIM 去做。」
這樣的 NIM,則可以被安裝在任何英偉達(dá)硬件適配的地方。比如英偉達(dá)的 DGX 系統(tǒng)上,任何云上、企業(yè)私有的數(shù)據(jù)中心、或者是個(gè)人的硬件上。黃仁勛直接在演講中說(shuō)道:「我們是 AI 鑄造廠。」
這項(xiàng)微服務(wù),現(xiàn)在開發(fā)者可以免費(fèi)試用。而企業(yè)則需要在企業(yè)軟件訂閱中,之前有消息稱,每個(gè) GPU 每年收取費(fèi)用 4500 美元。
03.「現(xiàn)實(shí) AI」:數(shù)字倉(cāng)庫(kù)和機(jī)器人在推進(jìn)算力和算力的使用上,英偉達(dá)是認(rèn)真的。英偉達(dá)在二十年前就做出了 CUDA,推崇加速計(jì)算,今日的碩果累累來(lái)自于二十年前種下的因。
黃仁勛開場(chǎng)時(shí)回顧二十年前,半開玩笑地講到:「當(dāng)時(shí)我們已經(jīng)算到了有今日?!?span style="display:none">Gpq28資訊網(wǎng)——每日最新資訊28at.com
而黃仁勛看到的未來(lái)是什么樣的呢?
在今天的 GTC 上,我們也小小地瞥見(jiàn)了一下黃仁勛眼中的未來(lái):在世界的底層,是無(wú)限擴(kuò)展的、不竭的算力,在中層,是數(shù)字孿生,是 simulation,是依靠算力帶來(lái)的對(duì)物理世界的無(wú)限精準(zhǔn)的模仿,實(shí)驗(yàn)和預(yù)測(cè),而在上層,則是一個(gè)依靠算力達(dá)到最優(yōu)解的世界 —— 在這個(gè)世界里,人與機(jī)器人共生。一切第一次發(fā)生的,都是發(fā)生過(guò)無(wú)數(shù)次的。
這其中,英偉達(dá) 2021 年開始推出的 Omniverse,就是中間層非常重要的工具。
Omniverse 是英偉達(dá)擅長(zhǎng)的計(jì)算機(jī)圖形、人工智能、科技計(jì)算和物理模擬真正大一統(tǒng)的平臺(tái),能夠?qū)Νh(huán)境實(shí)現(xiàn) 1:1 的數(shù)字孿生。
此次發(fā)布會(huì),結(jié)合人工智能的浪潮,Omniverse 展現(xiàn)了許多新的應(yīng)用可能。
Omniverse 可以為現(xiàn)在最火的具身智能,提供一個(gè)訓(xùn)練場(chǎng)所。英偉達(dá)表示,英偉達(dá)建立了 Isaac Lab,一款機(jī)器人學(xué)習(xí)應(yīng)用程序,用于在 Omniverse Isaac 模擬器上進(jìn)行訓(xùn)練。通過(guò)新的計(jì)算編排服務(wù),可以在基于物理的模擬中訓(xùn)練機(jī)器人,并能零次訓(xùn)練(zero-shot)遷移到實(shí)際環(huán)境。
機(jī)器人模型將使機(jī)器人能夠從少量人類演示中學(xué)習(xí),從視頻中理解人類、在模擬中訓(xùn)練模型,并最終直接部署到物理機(jī)器人上。
黃仁勛還在發(fā)布會(huì)上宣布了 ProjectGR00T 項(xiàng)目,GR00T 是一個(gè)用于人形機(jī)器人的通用基礎(chǔ)模型,基于 Jetson Thor(英偉達(dá)的一款 GPU)來(lái)開發(fā)生產(chǎn)機(jī)器人。
除此之外,英偉達(dá)還展示了一個(gè)數(shù)字倉(cāng)庫(kù)的案例。
視頻中,展示了一個(gè)一個(gè) 10 萬(wàn)平方英尺倉(cāng)庫(kù)的 Omniverse 模擬環(huán)境,它整合了運(yùn)行視頻、Isaac 感知器堆棧的數(shù)字工人 AMR、來(lái)自 100 個(gè)模擬天花板安裝攝像頭的整個(gè)倉(cāng)庫(kù)的集中活動(dòng)地圖等。
在視頻中,一個(gè)數(shù)字工人 AMR 的原定計(jì)劃的路線上,發(fā)生了一起事故,路徑受阻。英偉達(dá) Metropolis 可以實(shí)時(shí)改變路徑規(guī)劃。通過(guò)基于生成式 AI 的 Metropolis 視覺(jué)基礎(chǔ)模型,操作員甚至可以使用自然語(yǔ)言提問(wèn)發(fā)生了什么事情。
在此次 GTC 上,英偉達(dá)宣布,將創(chuàng)建 Omniverse Cloud 的 api,而且將非常易用,企業(yè)可以更容易地使用 Omniverse,同時(shí)其中還將有 AI 的能力。比如可以直接用自然語(yǔ)言場(chǎng)景描述,創(chuàng)建仿真環(huán)境的 3D 圖像。
同時(shí),英偉達(dá)宣布與 Vision Pro 達(dá)成合作,Omniverse Cloud 將能夠向 Vision Pro 串流?!笍奶摂M車上下來(lái),穿過(guò)車門的感覺(jué),非常奇怪,但也非常棒?!裹S仁勛講到,「Vision Pro 將把你帶入 Omniverse Cloud,你能夠體驗(yàn)到的工作流是無(wú)與倫比的。」
超過(guò) 1 萬(wàn)人在現(xiàn)場(chǎng)觀看 Keynote,900 場(chǎng)以上的分享以及數(shù)百家展商,2024 年 GTC 被戲稱為「AI 界的伍德斯托克」—— 除了蘋果公司,少有公司能讓科技變成一種人人想要「沾上邊」的時(shí)尚。畢竟,在「生成式 AI」代表未來(lái)的當(dāng)下,每個(gè)人都想成為那個(gè)跟上潮流的人。
英偉達(dá)無(wú)疑是那個(gè)潮流背后最大的推手之一,同時(shí)也是目前最大的受益方,它需要做的,是為所有人提供更大的夢(mèng)想,和更多的算力。順便,或許,成為全球市值最高的公司,沒(méi)有之一。
本文來(lái)自微信公眾號(hào):極客公園 (ID:geekpark),作者:宛辰、Li Yuan
本文鏈接:http://www.www897cc.com/showinfo-26-78869-0.html英偉達(dá)推「萬(wàn)億參數(shù)」GPU,繼續(xù)加速「AGI 時(shí)代」
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 又一場(chǎng)“宮斗戲”?Stability AI 首席執(zhí)行官辭職,要專注開發(fā)去中心化 AI