一個插件讓顯卡速度翻 3 倍?解密英偉達 AIGC 時代的最新王牌。
作者|云鵬
編輯|漠影
最近的 AIGC 圈著實迎來了一波新品發布小高潮!
先是谷歌 Gemini 突然深夜炸場,硬剛 OpenAI 的 GPT-4,然后是斯坦福科學家李飛飛團隊亮出 AI 視頻生成模型 W.A.L.T,拳打 Pika 腳踢 Gen-2,最近微軟又發布了手機端側都能跑的小語言模型 Phi-2,平均性能甚至超過 Llama 2。
AI 大模型火爆之下,各路科技巨頭幾乎都在“All in AI”,而 AI 軍備競賽已經很快從云端卷到了端側,從智能手機到 PC,我們身邊各類熟悉的智能硬件都已被卷入這場大模型浪潮。
各類智能助手、各類 AIGC 相關應用如雨后春筍般涌現,各類“GPTs”已經逐漸進入大眾視野。
熱況之下,AI 大模型在端側的落地離不開底層硬件的支持,英偉達、英特爾、AMD 等大廠也不斷亮出各種應對 AI 新時代的軟硬件新品,加速著 AI PC 時代的到來。PC 作為算力最強的消費級產品,成為 AI 大模型在端側應用的最理想平臺之一。
毫無疑問,AI 將成為 PC 產業發展的一個關鍵拐點,AI 也會徹底改變玩家、創作者、上班族、學生乃至每一個普通 PC 用戶的體驗。
目前全球搭載英偉達 RTX GPU 的 Windows PC 和工作站已經超過了 1 億臺,英偉達作為 AI 大模型時代最核心的全棧玩家,正通過全棧生態的賦能讓這些“RTX PC”的 AI 性能有翻倍式暴漲。
在我們熟悉的文生圖應用 Stable Diffusion 中,基于英偉達的 RTX 專用加速插件,一張 RTX 4090 僅用 49 秒就可以生成 100 張高質量圖像,速度翻了 3 倍,而這樣的升級甚至不需要改變其他硬件配置。
英偉達 RTX 相關技術在 AI 領域的應用,讓全球無數開發者可以更輕松、高效地創建 AI 應用,人們使用 PC 的方式,也在潛移默化中改變著。
英偉達如何為 AI PC 時代的底層筑基?英偉達在 AIGC 時代藏得最深的王牌又是什么?今天,從硬件、軟件到生態,英偉達似乎已經和 AI 畫上了等號。
01.從通用計算到加速計算,從數據中心到 PC,英偉達 CUDA 生態占 C 位今天的計算產業究竟醞釀著哪些關鍵變量,英偉達又在其中扮演著怎樣的角色?
正如英偉達 CEO 黃仁勛在財報電話會中提到的,放眼如今的全球計算產業,有兩個重要的轉變值得注意:第一,用一種通用處理器處理一切工作的傳統通用計算已經不再具有成本和效率的優勢,與之相對的“加速計算”將成為主流。
顧名思義,數據中心需要盡可能地去“加速”所有工作負載,這樣才能有更高的性能、能源效率和成本效益。
第二,在加速計算的大趨勢下,新的軟件開發方式成為了可能,這也推動了軟件平臺的轉變,讓以前無法實現的應用程序成為可能。
或許正如黃仁勛所說,AI 并不是一種奢侈品,AI 是必需品,AI 的投資是一種戰略性的迫切需求,可以幫企業提高未來的競爭力。
在這場“不能輸”的 AI 之戰中,英偉達的 GPU 儼然已經走到了舞臺中央,已經走到了全球“AI 新工業”的中央。在黃仁勛看來,如今的數據中心就像一座“AI 工廠”,數據是原材料,被生產、開發、精煉,轉化為世界上最有價值的東西 —— 智能。
顯然,這對于所有科技巨頭來說,都是一場技術乃至商業范式的革新。
在這樣的大背景下,各行各業都在經歷從通用計算到加速計算和生成式 AI 的平臺化轉型,而英偉達最新一季財報中數據中心業務接近 280% 的強勁同比增長也恰恰證明了這一點。
AI 大模型的初創公司、消費互聯網公司和全球云巨頭們都在積極“備戰”,各大云服務商不斷加大對 AI 云的投入,企業級軟件公司也陸續為自己的平臺增加 AI 相關應用和功能,不少廠商都推出了定制化 AI 產品,推動著各大行業的智能化、自動化發展。
熱潮之下,英偉達的 GPU、CPU、網絡、AI foundry、AI 企業軟件解決方案等產品和服務都成為加速這一轉型的核心“引擎”。
上述各行各業的智能化、自動化與計算產業密不可分,在計算產業中,除了數據中心在經歷“加速計算”的轉型,PC 產業作為計算的關鍵一環,也同樣經歷著類似的轉變。
當下,各類生成式 AI 產品正迅速成為高性能 PC 的支柱型應用,在各行各業從業者的日常工作中發揮著重要作用。而英偉達的 RTX GPU,無疑已成為 AI PC 時代最核心的底層技術支撐。
為什么英偉達的 GPU 能夠在 AI 時代走到如此關鍵的位置,并且幾乎是“不可替代”的?
實際上,提到英偉達的 GPU,就不得不提到 CUDA。在黃仁勛看來,英偉達是通過發明 CUDA 這種新編程工具,以及 GPU 這種處理器來推動加速計算的。
CPU 無法高效執行的工作,GPU 可以進行有效的加速,并且在性能、能源成本上有著顯著優勢。基于 CUDA 的 GPU 經歷近 25 年的發展,如今已經與開發者、系統制造商、云服務提供商、技術制造商和用戶深度綁定,CUDA 生態系統已經為各行各業所信任,這也是英偉達有著不可替代性的根本性因素之一。
在深度學習、AI 大模型的發展中,英偉達所提出的加速計算發揮著關鍵作用,生成式 AI 的崛起與其密不可分,這也被很多人稱之為“第四次工業革命”。
在黃仁勛看來,智能是最有價值的,倘若智能可以批量化、自動化的生產,其帶來的價值是不可估量的。
如今英偉達所做的,正是推動這一未來走入現實。
02.兼容性架構鋪路,TensorRT-LLM 讓推理性能翻倍,AI 繪圖進入“秒速時代”正如前文所說,英偉達在技術生態方面的布局,尤其是 25 年來在 CUDA 領域的深耕,是其能夠在 AI 時代占據 C 位的關鍵。而這樣的生態布局如今在 PC 產業中釋放的能量開始愈發凸顯。
今年四季度,英偉達發布了一個名為 TensorRT-LLM 的引擎優化編譯器,其目的就是進一步提升大語言模型的 AI 推理性能。
AI 大模型在云端的訓練需要消耗大量算力,而 AI 大模型真正走入每個人的生活,更需要解決推理這“最后一公里”的難題,因為實際場景中的推理任務往往是極為復雜的。
根據官方數據,在 TensorRT-LLM 的加持下,對于 Lambda2 這樣的大語言模型,H200 的推理能力可以提高到 H100 的 2 倍,成本也有著稱成倍降低,與 H100 相比,H200 在 GPT-3 模型上的推理性能有著 18 倍的提升,得益于此,英偉達的客戶可以使用更大的模型,但延遲卻不會增加。
實際上,TensorRT-LLM 有著這樣的表現,與 CUDA 的特性是密不可分的。英偉達 CFO 在財報電話會中特別提到,他們之所以能夠創建 TensorRT-LLM,正是因為 CUDA 是可編程的,如果 CUDA 和其對應的 GPU 不是可編程的,以如今這樣快的速度迭代改進軟件棧是很難實現的。
經過 20 多年的深耕,每一個英偉達 GPU 的背后,都是不斷迭代更新的軟件棧在做堅實支撐,而 CUDA 的靈活性和兼容性無一不是這一生態的突出優勢。
英偉達有著規模龐大的生態系統軟件開發人員、系統制造商生態系統和分銷合作網絡,而將這些真正連結在一起形成一個高效生態系統的,正是英偉達 CUDA 軟件生態和架構層面的兼容性。
英偉達 CFO 稱,一切基于兼容性構筑是他們幾十年前就做出的一個偉大決定,保證架構的兼容性也一直是他們的首要任務。
每當英偉達引入一個新的特性、新功能、新技術時,生態中的開發者們會立即從各個方面獲益,享受到這些紅利。目前英偉達在全球有 28000 名員工,他們服務于全球各地、各個行業、不同的市場和公司,但依然可以保持高效協作,這與良好的兼容性密不可分。
而這樣的兼容性進一步帶來的就是英偉達平臺的穩定性,這也是全球各類新應用幾乎都選擇率先在英偉達平臺上進行開發并進行優化的關鍵原因之一。
云計算領域的數據中心中有著數百萬英偉達 GPU,而全球 PC 和工作站用戶手中又有著 1 億多塊英偉達 GPU,他們在架構上都是兼容的,因此所有基于英偉達平臺實現的技術創新,都可以快速應用到這些數以百萬計、數以億計的產品中。
這也可以說是英偉達人無我有的核心優勢之一。
最后,在加速計算方面,英偉達 GPU 可以為 Spark、Python 甚至是目前最成功的數據科學框架 Pandas 進行加速,據了解,Pandas 現在由英偉達的 CUDA 加速,并且無需代碼行就能用起來。
在企業和專業領域之外,對于普通用戶來說,英偉達 GPU 帶來的加速能力也是感知極強的。
就在今年四季度,英偉達在發布 TensorRT-LLM 的同時也帶來了 TensorRT-LLM for Windows,與此同時,微軟也在 Ignite 大會上發布了 OpenAI Chat API 的 TensorRT-LLM 封裝接口、RTX 驅動的性能改進 DirectML for Llama 2 等新工具和資源。
可以說,Windows PC 的終端用戶們也可以享受到 TensorRT-LLM 帶來的加速紅利了。
根據官方數據,TensorRT-LLM?for Windows 可以將終端設備上的大語言模型推理性能最高提升 4 倍左右,而目前英偉達 RTX GPU 的裝機量已經超過了 1 億臺,這一新特性也已經快速全面普及開來,這對于應用程序開發者們來說無疑是一大喜訊。
TensorRT-LLM for Windows 的推出無疑意味著 AI 大模型可以更好的應用于端側 RTX PC 中,滿足用戶各類 AIGC 需求,提升用戶的 AI PC 體驗。
數以百計的 AI 相關開發者項目和應用都可以直接在搭載 RTX GPU 的 PC 上本地運行,同時,用戶的私人和專有數據也可以在 PC 本地進行保存。
值得一提的時,TensorRT-LLM 也在持續更新,支持更多新的熱門大模型,比如 Mistral 7B 和 Nemotron-3 8B,這些版本的 TensorRT-LLM 可以直接運行在 8GB 及以上顯存的 GeForce RTX 30 系列和 40 系列 GPU 上。
根據 Bilibili 平臺上一位專業設計師 UP 主 Nenly 同學的測試,在 Tensor RT 的加持下,Stable Diffusion 這一熱門文生圖應用基于 RTX GPU 生成的模型推理速度直接提升了 2 倍甚至 3 倍以上,AI 繪畫進入了“秒速時代”。
根據 Nenly 同學發布視頻,在 GeForce RTX 4090 上,Stable Diffusion 的運行速度是使用蘋果 M2 Ultra 的 Mac 頂配版的 7 倍。甚至 4060Ti 在 TensorRT 擴展的支持下,生成圖片的速度已經超過了加速前的 4090。
對于一些需要大量出具草圖的創意工作者們來說,這樣的加速能力所帶來的收益是極為明顯的。面對數千張圖片吞吐量的工作,節省下來的時間可能是以天計算的。
比如被譽為“插畫領域的劉慈欣”、“國內科幻繪畫第一人”,也是首位獲得全球雨果獎的華人藝術家趙恩哲,在工作中就使用了全流程經 GeForce RTX GPU 加速的 Stable Diffusion 進行創作,AI 輔助創作工具可以省掉細化時間,同時給他很多意向不到的創作設計可能。
趙恩哲特別說道,其實每位創作者都渴望將腦海中的世界完美呈現,但由于技術門檻和工業化流程等方面的限制,他們過去只能在概念設計與最終呈現之間做出妥協。但如今,借助英偉達 GeForce RTX 顯卡的強大算力以及 SD、RUNWAY 等 AI 創意工具,概念設計師可以突破限制,在短短幾秒內嘗試所有想法,相信今后有了更強大的算力加持,每位藝術家都可以實現無限創造!
當然,基于 RTX GPU 這些能力,相關公司也可以基于自己的模型構建具有最有效果的加速引擎,讓算力的效益最大化,從而實現顯著的降本增效。
可以說,從企業到個人,從數據中心到 PC,基于數十年建立的堅實生態,英偉達正通過技術創新拉近每一個人與 AI 大模型的距離。
03.DLSS 用 AI 改寫游戲產業,英偉達為開發者武裝到牙齒,RTX 就是 AI今天,我們看到了 Tensor RT 對于 PC 端側運行 AI 大模型能力帶來的顛覆式升級,而在此之外,英偉達 RTX GPU 已經深耕 AI 領域多年,如今提到 AI,幾乎就等于提到英偉達。用英偉達 CFO 的話來說,“RTX 就是 AI”。
在游戲領域,這一特點體現的尤為明顯。這其中最具代表性的就是 DLSS 技術,這也是英偉達最早推出的 AI 模型之一,從五年前的首次亮相至今,DLSS 技術經歷了多個大版本迭代,AI 技術的融入也愈發深入,目前已經包含超分辨率、幀生成和光線重建三個不同的模型。
據了解,從發布之初,DLSS 技術就一直離不開背后 AI 模型的持續學習,AI 模型學習的結果不斷反饋迭代,推動 DLSS 技術完善,進而提高 DLSS 技術在游戲中帶來的性能和畫質提升。
今年英偉達推出了 DLSS 3.5,其對于游戲圖形渲染技術發展的推動是極為明顯的,基于新的 AI 模型光線重建,DLSS 3.5 可以創建出更高質量的光線追蹤畫面,同時還能進一步提升游戲的幀率表現,可以說是一舉兩得。
這一技術也在游戲玩家中收到了廣泛好評。根據官方數據,目前支持 RTX 特性的游戲和應用已經超過了 500 個,這一生態系統的發展壯大,可以說為玩家們帶來了真正體驗上的直觀提升。
除了游戲,在生產力創作領域,根據官方數據,目前英偉達的 RTX GPU 加速了 110 多個創作類應用,尤其在生成式 AI 相關應用領域,RTX GPU 的應用更為廣泛。
如今,AI PC 時代的大門已經被推開了,各路廠商都在積極找準自己的定位,進行產品和技術的布局,而在這場時代大潮中,開發者們的作用至關重要,在 RTX 加持下,開發者現在可以直接利用前沿 AI 大模型,通過跨供應商 API 來部署自己的應用。
英偉達一直在做的,其實就是增強開發者的能力,在 AI 新時代為開發者們武裝到牙齒。英偉達提供的新優化、新模型和資源無疑會加速 AI 功能和應用在全球 1 億多臺 RTX PC 上的開發和部署,AI 與 PC 的融合,會變得越來越簡單。
04.結語:AIGC 時代要想玩轉 AI,英偉達是徹底繞不開了在 AIGC 風起云涌的當下,無數創企涌入賽道,消費者們也爭相接觸新的技術、感受生成式 AI 帶來的體驗革新,而英偉達無疑成為了風口浪尖上的一顆明星企業,從硬件、軟件到生態,英偉達的王牌一張接著一張。
AI 技術的發展,引起了整個計算產業范式的革新,加速計算概念的落地普及,牽動著全球各行各業的企業。從數據中心到我們每個人家中的 PC,英偉達的技術正深入每一處,在 AI 技術落地的過程中,發揮著關鍵作用。
如今回顧科技產業發展的歷史,我們能清楚地看到,那些最成功的公司,無一不是憑借生態取勝,從自身的產品技術生態到與產業鏈各領域玩家聯合形成的牢固生態,生態必然會成為當今科技巨頭們比拼的核心焦點。
不論如何,在當下的 AIGC 時代,想要乘風而行,走在浪尖,英偉達這艘大船,是必須要上了。
本文來自微信公眾號:芯東西 (ID:aichip001),作者:云鵬
本文鏈接:http://www.www897cc.com/showinfo-26-53250-0.html從軟硬件到生態加速 AI PC 革命,英偉達憑實力證明 RTX 就是 AI
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com