日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

PyTorch 架構優化庫 torchao 正式發布,可大幅提升 AI 模型效率

來源: 責編: 時間:2024-10-05 19:24:56 108觀看
導讀 10 月 2 日消息,據 PyTorch 新聞稿,PyTorch 旗下架構優化庫 torchao 現已正式發布,該優化庫主要專注于模型的量化和稀疏性優化,能夠在保證性能的同時降低模型的計算成本和 RAM 用量,從而提升模型運行效率,附 GitHub

10 月 2 日消息,據 PyTorch 新聞稿,PyTorch 旗下架構優化庫 torchao 現已正式發布,該優化庫主要專注于模型的量化和稀疏性優化,能夠在保證性能的同時降低模型的計算成本和 RAM 用量,從而提升模型運行效率,附 GitHub 頁面地址(點此訪問)。6Ud28資訊網——每日最新資訊28at.com

據介紹,torchao 提供了一系列優化工具集,可以幫助 LLaMA 3等流行的 AI 模型提升性能,其支持 float8、int4 等低精度數據類型,能夠有效減少硬件開銷和RAM用量。6Ud28資訊網——每日最新資訊28at.com

6Ud28資訊網——每日最新資訊28at.com

官方舉例,在 LLaMA 3 70B 模型的預訓練中,torchao 提供的 float8 訓練流程可將模型計算速度提升 1.5 倍。開發者只需利用 convert_to_float8_training 函數,即可將模型訓練轉換為 float8,從而輕松實現模型高效訓練。6Ud28資訊網——每日最新資訊28at.com

在推理方面,torchao 提供多種量化方法,包括權重量化(Weight-Only Quantization)和動態激活量化(Dynamic Activation Quantization),用戶可以自有選擇適合的量化策略,以獲得最佳的模型推理性能。6Ud28資訊網——每日最新資訊28at.com

在稀疏性優化方面,torchao 可以優化模型參數計算效率,據稱可讓 ViT-H 模型的推理速度提升 5%。同時,torchao 還可以將權重量化為 int4,并將鍵值緩存量化為 int8,可令 LLaMA 3.1 8B 在完整的 128K 上下文長度下僅占用 18.9GB 的顯存。6Ud28資訊網——每日最新資訊28at.com

6Ud28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-8027-0.htmlPyTorch 架構優化庫 torchao 正式發布,可大幅提升 AI 模型效率

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 發布 Realtime API,助力第三方應用集成其語音合成技術

下一篇: 非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

標簽:
  • 熱門焦點
  • 沉寂3年,大模型激活小度天貓精靈?

    Tech星球(微信ID:tech618)文 | 何煦陽 沉寂了許久的智能音箱,在今年大模型橫空出世之后,又再次燃起了新的希望。 2月9日,小度宣布將融合文心一言,打造針對智能設備場景的AI模型&ldq
  • 三院士三教授熱聊元宇宙&——AIGC,學術界怎么看?

    來源:清元宇宙在近日舉辦的中國江寧2023元宇宙產業·人才高峰論壇暨AIGC發展大會上,中國工程院院士譚建榮、劉韻潔、鄭緯民出席并發表了主旨演講。除了三
  • Layer1的新以太坊,更好的以太坊?

    以太坊作為區塊鏈基礎設施地位看起來已不可動搖,但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
  • 費城藝術家使用區塊鏈,在數字藝術中狠狠撈一筆

    ?你也想賺錢發財走上人生巔峰嗎?老雅痞給你指條路,現在也許是時候創建或購買或出售 NFT的好時機。費城地區的許多企業家都在這樣做。但投資需謹慎,入行有風險,在
  • Web 3如何改變傳統HR

    互聯網自誕生以來,經歷了三次迭代。Web1是第一階段,包括ISP服務器上的個人網頁或免費的虛擬主機服務。然后Web2出現了,它引入了動態的用戶生成內容、互操作性、增
  • 下一個黃金賽道?NFT的碎片化!

    碎片化可能是我們一生中最重要的一個投資趨勢,碎片化本身并不新鮮。它已經存在了400年之久。早在1602年,荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
  • 從4個方面解析2022年加密行業趨勢

    作者:去月球基礎設施瓶頸仍然存在盡管2021年公鏈基礎設施之間的競爭顯著升溫,但關鍵瓶頸仍需解決。例如,以太坊作為DApp開發的頂級公鏈,仍然遭受網絡擁塞和高額交
  • 技術賦能,國內首家寵物元宇宙平臺“Pet Meta”開啟虛擬養寵新方式

    作者:易明未來,Pet Meta數字寵物藏品將是鏈接全球數億愛寵人群與元宇宙世界獨一無二的身份象征。首家面向國內的寵物元宇宙平臺Pet Meta生長于“寵物經濟”快速
  • 頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

    特別聲明,我們的文章不作為投資建議,請各位讀者獨立思考,還是那句話:投資要慎之又慎,誰也不要相信。Gary Verneychuk 和百威 NFT 之一。由 VeynerNFT 提供百威推出

猜你喜歡

    SQL Error: select * from ***_ecms_news13 where id in(202,93,189,,175,97) limit 6
Top 主站蜘蛛池模板: 汪清县| 开江县| 兴仁县| 凤山市| 芜湖县| 正安县| 横山县| 海口市| 屏南县| 嫩江县| 印江| 湖南省| 运城市| 保德县| 康平县| 姚安县| 杨浦区| 乾安县| 青川县| 思南县| 阳东县| 堆龙德庆县| 麻城市| 大方县| 潜江市| 仪陇县| 武陟县| 邓州市| 博野县| 南木林县| 皮山县| 天柱县| 博爱县| 和平区| 温宿县| 虹口区| 崇左市| 同德县| 亳州市| 绥德县| 文化|