日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

27B 顯存需求 54 → 14.1GB:谷歌發布 Gemma 3 QAT AI 模型,RTX 3090 顯卡可運行

來源: 責編: 時間:2025-04-22 07:26:17 74觀看
導讀 4 月 19 日消息,谷歌公司昨日(4 月 18 日)發布博文,發布了量化感知訓練(QAT)優化版 Gemma 3 模型,在保持高質量的同時,降低內存需求。谷歌上月推出 Gemma 3 開源模型,能在單臺 NVIDIA H100 GPU 上以 BFloat16(BF16)精度

4 月 19 日消息,谷歌公司昨日(4 月 18 日)發布博文,發布了量化感知訓練(QAT)優化版 Gemma 3 模型,在保持高質量的同時,降低內存需求。51228資訊網——每日最新資訊28at.com

谷歌上月推出 Gemma 3 開源模型,能在單臺 NVIDIA H100 GPU 上以 BFloat16(BF16)精度高效運行。51228資訊網——每日最新資訊28at.com

51228資訊網——每日最新資訊28at.com

援引博文介紹,谷歌為響應用戶需求,致力于讓 Gemma 3 的強大性能適配普通硬件。量化技術是關鍵,通過降低模型參數的數值精度(如從 BF16 的 16 位降至 int4 的 4 位),類似圖像壓縮減少顏色數量,大幅減少數據存儲量。51228資訊網——每日最新資訊28at.com

以 int4 量化為例,Gemma 3 27B 顯存需求從 54GB 銳減至 14.1GB,Gemma 3 12B 則從 24GB 降至 6.6GB;Gemma 3 1B 僅需 0.5GB 顯存。51228資訊網——每日最新資訊28at.com

51228資訊網——每日最新資訊28at.com

這意味著用戶可在桌面(NVIDIA RTX 3090)或筆記本(NVIDIA RTX 4060 Laptop GPU)上運行強大 AI 模型,甚至手機也能支持小型模型。51228資訊網——每日最新資訊28at.com

為避免量化導致性能下降,谷歌采用量化感知訓練(QAT)技術,在訓練過程中模擬低精度運算,確保模型在壓縮后仍保持高準確性。Gemma 3 QAT 模型在約 5000 步訓練中,將困惑度下降減少了 54%。51228資訊網——每日最新資訊28at.com

Ollama、LM Studio 和 llama.cpp 等主流平臺已集成該模型,用戶可通過 Hugging Face 和 Kaggle 獲取官方 int4 和 Q4_0 模型,輕松在 Apple Silicon 或 CPU 上運行。此外,Gemmaverse 社區提供了更多量化選項,滿足不同需求。51228資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12448-0.html27B 顯存需求 54 → 14.1GB:谷歌發布 Gemma 3 QAT AI 模型,RTX 3090 顯卡可運行

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AI 競賽壓力山大:Meta 被曝資金缺口,向微軟、亞馬遜求援

下一篇: 微軟推動 AI 互操作性,發布兩大 MCP 服務器

標簽:
  • 熱門焦點
  • 10億基金,李彥宏呼喚下一個AI獨角獸

    ©?深響原創 · 作者|何文 AI太熱了。 在海外,OpenAI估值已超270億美元、英偉達市值破萬億、微軟把GPT整合進了全線產品。在國內,百度、阿里、華為、商湯等大公司,以及
  • 避坑指南:遠離具有這些特性的NFT

    關于NFT,在我們的文章中一直以來都是常駐嘉賓,不止因為NFT背后隱藏的潛力,更因為在這個NFT世界里冥冥之中仿佛有一雙幕后的手,OpenSea、庫里、ERC115、視覺中國、
  • “虛擬人”角斗場,基于“硬實力”下的人性平衡法則?

    在打工人“反內卷”的當下,一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》,央美畢業的虛擬人夏語冰登上央視節目《對話》,湖南
  • 江西將探索成立元宇宙聯盟,韓國將加強對NFT和元宇宙的監管

    《元宇宙新鮮事》有:江西將探索成立元宇宙聯盟,支持南昌規劃建設元宇宙試驗區;韓國金融監督局將加強對NFT和元宇宙的監管;任天堂社長表示暫時不打算加入元宇宙?!?/span>
  • Layer1的新以太坊,更好的以太坊?

    以太坊作為區塊鏈基礎設施地位看起來已不可動搖,但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
  • 智能人機交互技術的春晚大考

    1月初的一個早晨,京東智能客戶服務產品部緊急開會,進行關于尚未對外公布的“X項目”的初討論。1月5日,這個神秘的X項目對外公布,京東成為央視2022年春晚獨家互動合
  • 2022年元宇宙系列報告:UGC當道,XR帶來新交互體驗

    UGC作為元宇宙的主要內容創作模式,已經越來越多的呈現于游戲、娛樂、社交、傳媒等方面,UGC模式勾勒了元宇宙的邊界,現今元宇宙UGC模式的主要呈現方式以元宇宙概念
  • 對諷刺無動于衷,Nori將碳市場放在區塊鏈上

    當我們聊氣候問題的解決方案時,以太坊區塊鏈應該不是最首想到的,但這正是Nori所選擇的方案,它建立了一個引擎,鼓勵農民使用負碳耕作方法,將空氣中的碳抽出并放回地
  • Meta 呼吁行業合作建立元宇宙網絡基礎設施

    Facebook 的母公司 Meta呼吁,建立必要的全球合作的基礎設施,以支持其蓬勃發展的元宇宙野心?!霸钪妗背蔀?2021 年的主要流行語之一,這在很大程度上是由 Facebo
Top 主站蜘蛛池模板: 军事| 屯昌县| 通州市| 饶河县| 灌阳县| 迁西县| 威宁| 平塘县| 宁明县| 仙居县| 凤庆县| 迁安市| 闵行区| 宜丰县| 温州市| 浙江省| 蓬安县| 拉孜县| 邢台市| 阜新| 化隆| 彝良县| 徐州市| 洮南市| 赤峰市| 沈阳市| 海原县| 广灵县| 尤溪县| 镇赉县| 海兴县| 荆门市| 洪泽县| 礼泉县| 喀喇沁旗| 留坝县| 论坛| 巴彦县| 东莞市| 铜川市| 蒲城县|