當前位置：首頁 > 元宇宙 > AI

27B 顯存需求 54 → 14.1GB：谷歌發布 Gemma 3 QAT AI 模型，RTX 3090 顯卡可運行

來源：責編：時間：2025-04-22 07:26:17 74觀看

導讀 4 月 19 日消息，谷歌公司昨日（4 月 18 日）發布博文，發布了量化感知訓練（QAT）優化版 Gemma 3 模型，在保持高質量的同時，降低內存需求。谷歌上月推出 Gemma 3 開源模型，能在單臺 NVIDIA H100 GPU 上以 BFloat16（BF16）精度

4 月 19 日消息，谷歌公司昨日（4 月 18 日）發布博文，發布了量化感知訓練（QAT）優化版 Gemma 3 模型，在保持高質量的同時，降低內存需求。

谷歌上月推出 Gemma 3 開源模型，能在單臺 NVIDIA H100 GPU 上以 BFloat16（BF16）精度高效運行。

援引博文介紹，谷歌為響應用戶需求，致力于讓 Gemma 3 的強大性能適配普通硬件。量化技術是關鍵，通過降低模型參數的數值精度（如從 BF16 的 16 位降至 int4 的 4 位），類似圖像壓縮減少顏色數量，大幅減少數據存儲量。

以 int4 量化為例，Gemma 3 27B 顯存需求從 54GB 銳減至 14.1GB，Gemma 3 12B 則從 24GB 降至 6.6GB；Gemma 3 1B 僅需 0.5GB 顯存。

這意味著用戶可在桌面（NVIDIA RTX 3090）或筆記本（NVIDIA RTX 4060 Laptop GPU）上運行強大 AI 模型，甚至手機也能支持小型模型。

為避免量化導致性能下降，谷歌采用量化感知訓練（QAT）技術，在訓練過程中模擬低精度運算，確保模型在壓縮后仍保持高準確性。Gemma 3 QAT 模型在約 5000 步訓練中，將困惑度下降減少了 54%。

Ollama、LM Studio 和 llama.cpp 等主流平臺已集成該模型，用戶可通過 Hugging Face 和 Kaggle 獲取官方 int4 和 Q4_0 模型，輕松在 Apple Silicon 或 CPU 上運行。此外，Gemmaverse 社區提供了更多量化選項，滿足不同需求。

本文鏈接：http://www.www897cc.com/showinfo-45-12448-0.html27B 顯存需求 54 → 14.1GB：谷歌發布 Gemma 3 QAT AI 模型，RTX 3090 顯卡可運行

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： AI 競賽壓力山大：Meta 被曝資金缺口，向微軟、亞馬遜求援

下一篇：微軟推動 AI 互操作性，發布兩大 MCP 服務器

標簽：

熱門焦點

避坑指南：遠離具有這些特性的NFT

關于NFT，在我們的文章中一直以來都是常駐嘉賓，不止因為NFT背后隱藏的潛力，更因為在這個NFT世界里冥冥之中仿佛有一雙幕后的手，OpenSea、庫里、ERC115、視覺中國、
“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

在打工人“反內卷”的當下，一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》，央美畢業的虛擬人夏語冰登上央視節目《對話》，湖南
江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

《元宇宙新鮮事》有：江西將探索成立元宇宙聯盟，支持南昌規劃建設元宇宙試驗區；韓國金融監督局將加強對NFT和元宇宙的監管；任天堂社長表示暫時不打算加入元宇宙?！?/span>
Layer1的新以太坊，更好的以太坊？

以太坊作為區塊鏈基礎設施地位看起來已不可動搖，但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
智能人機交互技術的春晚大考

1月初的一個早晨，京東智能客戶服務產品部緊急開會，進行關于尚未對外公布的“X項目”的初討論。1月5日，這個神秘的X項目對外公布，京東成為央視2022年春晚獨家互動合
2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

UGC作為元宇宙的主要內容創作模式，已經越來越多的呈現于游戲、娛樂、社交、傳媒等方面，UGC模式勾勒了元宇宙的邊界，現今元宇宙UGC模式的主要呈現方式以元宇宙概念
對諷刺無動于衷，Nori將碳市場放在區塊鏈上

當我們聊氣候問題的解決方案時，以太坊區塊鏈應該不是最首想到的，但這正是Nori所選擇的方案，它建立了一個引擎，鼓勵農民使用負碳耕作方法，將空氣中的碳抽出并放回地
Meta 呼吁行業合作建立元宇宙網絡基礎設施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基礎設施，以支持其蓬勃發展的元宇宙野心?！霸钪妗背蔀?2021 年的主要流行語之一，這在很大程度上是由 Facebo

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

27B 顯存需求 54 → 14.1GB：谷歌發布 Gemma 3 QAT AI 模型，RTX 3090 顯卡可運行

10億基金，李彥宏呼喚下一個AI獨角獸

避坑指南：遠離具有這些特性的NFT

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

Layer1的新以太坊，更好的以太坊？

智能人機交互技術的春晚大考

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

對諷刺無動于衷，Nori將碳市場放在區塊鏈上

Meta 呼吁行業合作建立元宇宙網絡基礎設施

最新推薦

超跑與NFT的首次結合，蘭博基尼能否破局？

冰墩墩還能火多久？

從冰墩墩到無聊猿，解秘未來IP爆款的模因

Meta正在研發元宇宙語音助手；廣東省462家企業申請元宇宙商標

趙長鵬預測SoicalFi為今年主要驅動力，新的機會在哪里？

NFT行業周報：NBA巨星勒布朗·詹姆斯申請NFT相關商標

猜你喜歡

熱門推薦

相關資訊