當(dāng)前位置：首頁 > 元宇宙 > AI

英偉達(dá)H100啟用TensorRT-LLM：AI推理性能飆升

來源：責(zé)編：時(shí)間：2023-09-10 23:26:57 362觀看

導(dǎo)讀9月9日消息，英偉達(dá)公司今日宣布推出了一項(xiàng)名為TensorRT-LLM的創(chuàng)新項(xiàng)目，旨在大幅提升其Hopper系列AIGPU上的語言模型推理性能。根據(jù)英偉達(dá)的介紹，TensorRT-LLM是一款深度優(yōu)化的開源庫，利用了一系列尖端技術(shù)，包括SmoothQuant

9月9日消息，英偉達(dá)公司今日宣布推出了一項(xiàng)名為TensorRT-LLM的創(chuàng)新項(xiàng)目，旨在大幅提升其Hopper系列AIGPU上的語言模型推理性能。根據(jù)英偉達(dá)的介紹，TensorRT-LLM是一款深度優(yōu)化的開源庫，利用了一系列尖端技術(shù)，包括SmoothQuant、FlashAttention和fMHA等，以加速處理大型語言模型，如GPT-3(175B)、Llama Falcom(180 B)和Bloom等模型。

據(jù)悉，TensorRT-LLM的一個(gè)顯著特點(diǎn)是引入了一種名為In-FlightBatching的調(diào)度方案，這使得GPU能夠在處理大型計(jì)算密集型請(qǐng)求時(shí)，同時(shí)動(dòng)態(tài)處理多個(gè)較小的查詢。這一創(chuàng)新性的方案不僅提高了GPU的性能，還使得H100型號(hào)的吞吐量提高了2倍。

在性能測試方面，英偉達(dá)以A100作為基準(zhǔn)，對(duì)比了H100和啟用了TensorRT-LLM的H100。在GPT-J6B模型的推理性能測試中，H100相比A100提升了4倍，而啟用了TensorRT-LLM的H100性能更是達(dá)到了A100的8倍。而在Llama2模型上，H100相比A100提升了2.6倍，而啟用了TensorRT-LLM的H100性能則高達(dá)A100的4.6倍。

這一重大突破意味著英偉達(dá)將繼續(xù)領(lǐng)導(dǎo)AI硬件領(lǐng)域的發(fā)展，通過優(yōu)化其GPU性能，為大型語言模型等計(jì)算密集型任務(wù)提供更快速和高效的計(jì)算支持。據(jù)ITBEAR科技資訊了解，這將對(duì)人工智能應(yīng)用在各個(gè)領(lǐng)域的發(fā)展產(chǎn)生積極影響，為未來的科技創(chuàng)新打開更廣闊的可能性。

本文鏈接：http://www.www897cc.com/showinfo-45-1934-0.html英偉達(dá)H100啟用TensorRT-LLM：AI推理性能飆升

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：生成式人工智能預(yù)測：2030年將重塑美國工作市場

下一篇：藝術(shù)家聯(lián)名信呼吁美國國會(huì)關(guān)注生成式AI在藝術(shù)領(lǐng)域的重要性

標(biāo)簽：

熱門焦點(diǎn)

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

來源：清元宇宙炎炎夏日努力工作的Q仔的電腦都冒煙兒啦～今天要給大家介紹兩個(gè)新小伙伴——小元和小媧，他們將給大家解讀元媧2.7版本重磅更新內(nèi)容～大家掌聲歡迎～～～本次更
錯(cuò)過了BRC20還有eths,eth銘文協(xié)議

來源：三頭鳥NFT大家好，我是鳥哥，了解鳥哥的人都知道鳥哥擅擼空投，說實(shí)話擼毛雖然回報(bào)大但周期還是有點(diǎn)長的，所以除了擼毛我們自己也在研究早期項(xiàng)目，打新，比如BRC20協(xié)議ordi當(dāng)時(shí)就有
花房集團(tuán)上市，走向元宇宙新征程

文 | 港股研究社作者 | 熊生12月12日，花房集團(tuán)在港交所成功上市，首日便受到追捧，當(dāng)日最高漲幅達(dá)28.75%。繼360、360數(shù)科、魯大師后，這是“紅衣教主”周
2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價(jià)值？

在剛剛結(jié)束不久的2021年江蘇衛(wèi)視跨年演唱會(huì)上，虛擬鄧麗君與歌手周深同臺(tái)聯(lián)唱，實(shí)現(xiàn)了跨時(shí)代合作，而這還不只是“鄧麗君”，嗶哩嗶哩、東方衛(wèi)視等多家跨年晚會(huì)都出現(xiàn)
米哈游推出元宇宙品牌；VR/AR老牌企業(yè)當(dāng)紅齊天完成B輪+融資

今日熱點(diǎn)：蘋果AR/VR頭顯的FaceTime或基于Memojis和SharePlay構(gòu)建而成；VR/AR老牌企業(yè)當(dāng)紅齊天完成B輪+融資；米哈游推出元宇宙品牌HoYoverse；國產(chǎn)VR射擊游戲《Contra
重溫 1602 年：DAO 是新的企業(yè)范式嗎？

作者：Andrew Singer“ 將你的選票委托給行業(yè)有能力的專家，將使所有者在這些公司的管理中擁有更強(qiáng)大、更清晰的話語權(quán) 。”1602 年，荷蘭東印度公司成立，許多人認(rèn)為
就業(yè)年齡歧視如何解決？來Web3看看

上周，我突然想到我的第一份工作實(shí)際上是在為一家失敗的航空公司制定破產(chǎn)退出計(jì)劃，那年我們的協(xié)議實(shí)習(xí)生剛出生。在一陣恐慌后，我又花了一點(diǎn)時(shí)間反思我這個(gè)擁有近1
藝術(shù)創(chuàng)作者能否永久收取版稅？

NFTs正在改變我們理解互聯(lián)網(wǎng)所有權(quán)的方式，社區(qū)管理的所有權(quán)有很多好處，但如果創(chuàng)作者想為他/她的創(chuàng)作獲得永久的收益（版稅），會(huì)發(fā)生什么？這不是一個(gè)容易解決的問題，版稅
Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基礎(chǔ)設(shè)施，以支持其蓬勃發(fā)展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一，這在很大程度上是由 Facebo

76億美金估值、2022年最具創(chuàng)新力公司，Dapper Labs如何做到？

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

英偉達(dá)H100啟用TensorRT-LLM：AI推理性能飆升

元媧2.7上線：虛擬人視頻制作速度瘋狂翻倍！

錯(cuò)過了BRC20還有eths,eth銘文協(xié)議

花房集團(tuán)上市，走向元宇宙新征程

2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價(jià)值？

米哈游推出元宇宙品牌；VR/AR老牌企業(yè)當(dāng)紅齊天完成B輪+融資

重溫 1602 年：DAO 是新的企業(yè)范式嗎？

就業(yè)年齡歧視如何解決？來Web3看看

藝術(shù)創(chuàng)作者能否永久收取版稅？

Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

最新推薦

新周期，誰在堅(jiān)守窄門？

這一超級(jí)富豪“逆襲”，身價(jià)大增4330億

從概念到落地 Web3.0初具雛形

元宇宙不完全是想出來的，而是實(shí)打?qū)嵶龀鰜淼?/a>

淺聊DAO圖景和未來

猜你喜歡

熱門推薦

相關(guān)資訊