當前位置：首頁 > 元宇宙 > AI

蘋果發布 FastVLM 視覺語言模型，為新型智能眼鏡等穿戴設備鋪路

來源：責編：時間：2025-05-15 09:50:57 67觀看

導讀 5 月 13 日消息，蘋果機器學習團隊上周在 GitHub 發布并開源了一款視覺語言模型 ——FastVLM，提供 0.5B、1.5B、7B 三個版本。據介紹，該模型基于蘋果自研 MLX 框架開發并借助LLaVA 代碼庫進行訓練，專為 Apple Sili

5 月 13 日消息，蘋果機器學習團隊上周在 GitHub 發布并開源了一款視覺語言模型 ——FastVLM，提供 0.5B、1.5B、7B 三個版本。

據介紹，該模型基于蘋果自研 MLX 框架開發并借助LLaVA 代碼庫進行訓練，專為 Apple Silicon 設備的端側 AI 運算進行優化。

技術文檔顯示，FastVLM 在保持精度的前提下，實現了高分辨率圖像處理的近實時響應，同時所需的計算量比同類模型要少得多。

其核心是一個名為 FastViTHD 的混合視覺編碼器。蘋果團隊表示，該編碼器“專為在高分辨率圖像上實現高效的 VLM 性能而設計”，其處理速度較同類模型提升 3.2 倍，體積卻僅有 3.6 分之一。

亮點

FastViTHD 新型混合視覺編碼器：專為高分辨率圖像優化設計，可減少令牌輸出量并顯著縮短編碼時間

最小模型版本性能對比：較 LLaVA-OneVision-0.5B 模型實現首詞元（Token）響應速度提升 85 倍，視覺編碼器體積縮小 3.4 倍

搭配 Qwen2-7B 大語言模型版本：使用單一圖像編碼器即超越 Cambrian-1-8B 等近期研究成果，首詞元響應速度提升 7.9 倍

配套 iOS 演示應用：實機展示移動端模型性能表現

蘋果技術團隊指出：“基于對圖像分辨率、視覺延遲、詞元數量與LLM 大小的綜合效率分析，我們開發出 FastVLM—— 該模型在延遲、模型大小和準確性之間實現了最優權衡。”

該技術的應用場景指向蘋果正在研發的智能眼鏡類穿戴設備。多方信息顯示，蘋果計劃于 2027 年推出對標 Meta Ray-Bans 的 AI 眼鏡，同期或將發布搭載攝像頭的 AirPods 設備。

FastVLM 的本地化處理能力可有效支持此類設備脫離云端實現實時視覺交互。查詢獲悉，MLX 框架允許開發者在 Apple 設備本地訓練和運行模型，同時兼容主流 AI 開發語言。FastVLM 的推出證實蘋果正構建完整的端側 AI 技術生態。

參考資料：

https://github.com/apple/ml-fastvlm?tab=readme-ov-file

[2412.13303] FastVLM: Efficient Vision Encoding for Vision Language Models

本文鏈接：http://www.www897cc.com/showinfo-45-12845-0.html蘋果發布 FastVLM 視覺語言模型，為新型智能眼鏡等穿戴設備鋪路

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： SDS 技術首次用于音頻：英偉達攜手 MIT 推 Audio-SDS，參數化控制 AI 音效生成

下一篇： OpenAI 高管：AI 未來可自主生成知識，商業與科研迎來革命

標簽：

熱門焦點

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

虛擬數字人行業未來的主要驅動力包括：用戶代際變化，新一代消費者對內容消費和虛擬世界更為渴求；虛擬數字人相關技術門檻相對降低，成本有所回落；資本熱度上升，受Metav
企業熱、用戶冷，元宇宙第一站將是“營銷場”？

如果說2021年底什么最火熱，那元宇宙當之無愧。“萬物皆可元宇宙”似乎成為新的流行語，在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日，有消息傳
韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

韓國投資公司(KIC)CEO Seoungho Jin預計，該公司在舊金山的辦事處今年將擴招人手，探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
NFT的未來：傳統企業與去中心化機構之間的競賽

傳統企業和去中心化機構一直存在分歧，但最近NFT的爆炸式增長讓他們產生了共同的興趣，雙方都在競相讓用戶更輕松、更方便地使用NFT。毫無疑問，NFT 市場正在增長。
借VR產業東風，江西搶灘布局“元宇宙”

自2016年起就在VR上傾注了大量精力的江西省，迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口，使人們可以在數字空間和物理空間自由穿梭。自2016年起
以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

作者：三黎過去的一年里，除了 BTC 一如既往穩坐王位，DEFI 則是貫穿一整年的狂歡熱點。 DeFi 在讓 ETH 實現價值增長的同時，也使得其網絡日漸擁堵、交易費用增高，成為
過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

Web 2.0 是由幾家“直男”大公司塑造的。接下來的Web3世界中，如果女性在創造性方面發揮更大的作用，可能會讓這個新時代更受歡迎、更安全和公平。當我們談論 Web3
參加元宇宙里的招聘會是什么樣一種體驗？

求職者可以在活動中走動，就像他們在現實生活中一樣。長話短說看亮點：招聘公司Hirect為Y-combinator支持的初創公司舉辦了一場元宇宙招聘會。這里有一個大廳、一
全球十大元宇宙概念游戲

A股市場中，不少游戲公司早早搭上了元宇宙概念。舉例，中青寶宣稱將發布一款元宇宙概念的模擬經營類游戲，盡管游戲尚在研發中，這一消息已經讓中青寶的股價在51個交易

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

蘋果發布 FastVLM 視覺語言模型，為新型智能眼鏡等穿戴設備鋪路

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

NFT的未來：傳統企業與去中心化機構之間的競賽

借VR產業東風，江西搶灘布局“元宇宙”

以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

參加元宇宙里的招聘會是什么樣一種體驗？

全球十大元宇宙概念游戲

最新推薦

VR/AR迷失元宇宙“硝煙”

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

“元宇宙第一股”Roblox緣何被資本市場看“低”？

8個最適合藝術家發行NFT的交易市場

費城藝術家使用區塊鏈，在數字藝術中狠狠撈一筆

又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

猜你喜歡

熱門推薦

相關資訊