日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 元宇宙 > AI

27B 顯存需求 54 → 14.1GB:谷歌發(fā)布 Gemma 3 QAT AI 模型,RTX 3090 顯卡可運(yùn)行

來(lái)源: 責(zé)編: 時(shí)間:2025-04-22 07:26:17 43觀看
導(dǎo)讀 4 月 19 日消息,谷歌公司昨日(4 月 18 日)發(fā)布博文,發(fā)布了量化感知訓(xùn)練(QAT)優(yōu)化版 Gemma 3 模型,在保持高質(zhì)量的同時(shí),降低內(nèi)存需求。谷歌上月推出 Gemma 3 開(kāi)源模型,能在單臺(tái) NVIDIA H100 GPU 上以 BFloat16(BF16)精度

4 月 19 日消息,谷歌公司昨日(4 月 18 日)發(fā)布博文,發(fā)布了量化感知訓(xùn)練(QAT)優(yōu)化版 Gemma 3 模型,在保持高質(zhì)量的同時(shí),降低內(nèi)存需求。wkn28資訊網(wǎng)——每日最新資訊28at.com

谷歌上月推出 Gemma 3 開(kāi)源模型,能在單臺(tái) NVIDIA H100 GPU 上以 BFloat16(BF16)精度高效運(yùn)行。wkn28資訊網(wǎng)——每日最新資訊28at.com

wkn28資訊網(wǎng)——每日最新資訊28at.com

援引博文介紹,谷歌為響應(yīng)用戶需求,致力于讓 Gemma 3 的強(qiáng)大性能適配普通硬件。量化技術(shù)是關(guān)鍵,通過(guò)降低模型參數(shù)的數(shù)值精度(如從 BF16 的 16 位降至 int4 的 4 位),類(lèi)似圖像壓縮減少顏色數(shù)量,大幅減少數(shù)據(jù)存儲(chǔ)量。wkn28資訊網(wǎng)——每日最新資訊28at.com

以 int4 量化為例,Gemma 3 27B 顯存需求從 54GB 銳減至 14.1GB,Gemma 3 12B 則從 24GB 降至 6.6GB;Gemma 3 1B 僅需 0.5GB 顯存。wkn28資訊網(wǎng)——每日最新資訊28at.com

wkn28資訊網(wǎng)——每日最新資訊28at.com

這意味著用戶可在桌面(NVIDIA RTX 3090)或筆記本(NVIDIA RTX 4060 Laptop GPU)上運(yùn)行強(qiáng)大 AI 模型,甚至手機(jī)也能支持小型模型。wkn28資訊網(wǎng)——每日最新資訊28at.com

為避免量化導(dǎo)致性能下降,谷歌采用量化感知訓(xùn)練(QAT)技術(shù),在訓(xùn)練過(guò)程中模擬低精度運(yùn)算,確保模型在壓縮后仍保持高準(zhǔn)確性。Gemma 3 QAT 模型在約 5000 步訓(xùn)練中,將困惑度下降減少了 54%。wkn28資訊網(wǎng)——每日最新資訊28at.com

Ollama、LM Studio 和 llama.cpp 等主流平臺(tái)已集成該模型,用戶可通過(guò) Hugging Face 和 Kaggle 獲取官方 int4 和 Q4_0 模型,輕松在 Apple Silicon 或 CPU 上運(yùn)行。此外,Gemmaverse 社區(qū)提供了更多量化選項(xiàng),滿足不同需求。wkn28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12448-0.html27B 顯存需求 54 → 14.1GB:谷歌發(fā)布 Gemma 3 QAT AI 模型,RTX 3090 顯卡可運(yùn)行

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: AI 競(jìng)賽壓力山大:Meta 被曝資金缺口,向微軟、亞馬遜求援

下一篇: 微軟推動(dòng) AI 互操作性,發(fā)布兩大 MCP 服務(wù)器

標(biāo)簽:
  • 熱門(mén)焦點(diǎn)
  • VR/AR迷失元宇宙“硝煙”

    不溫不火的VR/AR可穿戴設(shè)備因元宇宙崛起火了一陣,又隨著元宇宙回歸平靜。1月份,微軟在 Surface 設(shè)備、HoloLens 混合現(xiàn)實(shí)硬件和 Xbox 等部門(mén)裁員,其中負(fù)責(zé)混合現(xiàn)實(shí)硬件(MR)的Holo
  • 網(wǎng)易音樂(lè)、理想申請(qǐng)?jiān)钪嫔虡?biāo)被駁回,“啫喱”暫停新用戶進(jìn)入

    【《原神》開(kāi)發(fā)商米哈游宣布創(chuàng)立元宇宙品牌】《原神》開(kāi)發(fā)商米哈游宣布推出元宇宙品牌 HoYoverse,旨在通過(guò)各種娛樂(lè)服務(wù)為全球玩家創(chuàng)造并提供沉浸式虛擬世界體
  • 傳騰訊已推出全新XR業(yè)務(wù);摩托羅拉正打造5GXR頸戴式計(jì)算組件

    今日熱點(diǎn):傳騰訊已推出全新XR業(yè)務(wù);摩托羅拉與Verizon合作打造5G XR頸戴式計(jì)算組件;小米AR購(gòu)物導(dǎo)航專(zhuān)利獲授權(quán);VR一體機(jī)Simula One放棄眾籌并開(kāi)放直接預(yù)訂;VR游戲《
  • 2022年6款最佳的NFT稀有度查詢工具

    NFT正在風(fēng)靡全球,但擁有一個(gè)你自認(rèn)為看起來(lái)很酷的 NFT 是不夠的,因?yàn)樗€應(yīng)該是稀有的,稀有度會(huì)影響每個(gè) NFT 的價(jià)值。因此,如果您打算投資 NFT,則需要使用 NFT 稀
  • 2021年中國(guó)元宇宙行業(yè)用戶行為分析熱點(diǎn)報(bào)告

    元宇宙網(wǎng)絡(luò)熱度高漲,中國(guó)網(wǎng)民對(duì)虛擬生態(tài)興趣濃厚。艾媒咨詢數(shù)據(jù)顯示,超六成的網(wǎng)民對(duì)“元宇宙”了解程度較高,在元宇宙較基礎(chǔ)的游戲領(lǐng)域,超九成的人對(duì)VR游戲更感興
  • 虛擬數(shù)字人:元宇宙的主角破圈而來(lái)

    虛擬數(shù)字人市場(chǎng)逐步進(jìn)入成熟期,商業(yè)化進(jìn)程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級(jí)和成長(zhǎng)四個(gè)階段。隨技術(shù)逐年突破,制
  • Meta 在衰落嗎?

    扎克伯格已經(jīng)很久沒(méi)有出現(xiàn)在公眾視野里了,近日,他罕見(jiàn)的接受播客采訪,在兩個(gè)小時(shí)的時(shí)間里暢談了Meta、Facebook、Instagram、元宇宙的未來(lái)。正方觀點(diǎn):是的阿倫·達(dá)
  • 從4個(gè)方面解析2022年加密行業(yè)趨勢(shì)

    作者:去月球基礎(chǔ)設(shè)施瓶頸仍然存在盡管2021年公鏈基礎(chǔ)設(shè)施之間的競(jìng)爭(zhēng)顯著升溫,但關(guān)鍵瓶頸仍需解決。例如,以太坊作為DApp開(kāi)發(fā)的頂級(jí)公鏈,仍然遭受網(wǎng)絡(luò)擁塞和高額交
  • 技術(shù)賦能,國(guó)內(nèi)首家寵物元宇宙平臺(tái)“Pet Meta”開(kāi)啟虛擬養(yǎng)寵新方式

    作者:易明未來(lái),Pet Meta數(shù)字寵物藏品將是鏈接全球數(shù)億愛(ài)寵人群與元宇宙世界獨(dú)一無(wú)二的身份象征。首家面向國(guó)內(nèi)的寵物元宇宙平臺(tái)Pet Meta生長(zhǎng)于“寵物經(jīng)濟(jì)”快速
Top 主站蜘蛛池模板: 西华县| 威海市| 青神县| 九寨沟县| 廉江市| 称多县| 府谷县| 伊通| 体育| 马尔康县| 青河县| 卓尼县| 安远县| 哈巴河县| 邵东县| 永济市| 三门县| 浪卡子县| 松滋市| 旬阳县| 田林县| 舒兰市| 樟树市| 会泽县| 那曲县| 司法| 宣化县| 阿鲁科尔沁旗| 云林县| 南江县| 垫江县| 久治县| 庄浪县| 仲巴县| 潢川县| 抚松县| 乌拉特前旗| 贡山| 佛山市| 石台县| 斗六市|