日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

蘋果發布 FastVLM 視覺語言模型,為新型智能眼鏡等穿戴設備鋪路

來源: 責編: 時間:2025-05-15 09:50:57 26觀看
導讀 5 月 13 日消息,蘋果機器學習團隊上周在 GitHub 發布并開源了一款視覺語言模型 ——FastVLM,提供 0.5B、1.5B、7B 三個版本。據介紹,該模型基于蘋果自研 MLX 框架開發并借助LLaVA 代碼庫進行訓練,專為 Apple Sili

5 月 13 日消息,蘋果機器學習團隊上周在 GitHub 發布并開源了一款視覺語言模型 ——FastVLM,提供 0.5B、1.5B、7B 三個版本。kLR28資訊網——每日最新資訊28at.com

據介紹,該模型基于蘋果自研 MLX 框架開發并借助LLaVA 代碼庫進行訓練,專為 Apple Silicon 設備的端側 AI 運算進行優化。kLR28資訊網——每日最新資訊28at.com

技術文檔顯示,FastVLM 在保持精度的前提下,實現了高分辨率圖像處理的近實時響應,同時所需的計算量比同類模型要少得多。kLR28資訊網——每日最新資訊28at.com

kLR28資訊網——每日最新資訊28at.com

其核心是一個名為 FastViTHD 的混合視覺編碼器。蘋果團隊表示,該編碼器“專為在高分辨率圖像上實現高效的 VLM 性能而設計”,其處理速度較同類模型提升 3.2 倍,體積卻僅有 3.6 分之一。kLR28資訊網——每日最新資訊28at.com

亮點

FastViTHD 新型混合視覺編碼器:專為高分辨率圖像優化設計,可減少令牌輸出量并顯著縮短編碼時間kLR28資訊網——每日最新資訊28at.com

最小模型版本性能對比:較 LLaVA-OneVision-0.5B 模型實現首詞元(Token)響應速度提升 85 倍,視覺編碼器體積縮小 3.4 倍kLR28資訊網——每日最新資訊28at.com

搭配 Qwen2-7B 大語言模型版本:使用單一圖像編碼器即超越 Cambrian-1-8B 等近期研究成果,首詞元響應速度提升 7.9 倍kLR28資訊網——每日最新資訊28at.com

配套 iOS 演示應用:實機展示移動端模型性能表現kLR28資訊網——每日最新資訊28at.com

kLR28資訊網——每日最新資訊28at.com

蘋果技術團隊指出:“基于對圖像分辨率、視覺延遲、詞元數量與LLM 大小的綜合效率分析,我們開發出 FastVLM—— 該模型在延遲、模型大小和準確性之間實現了最優權衡。”kLR28資訊網——每日最新資訊28at.com

該技術的應用場景指向蘋果正在研發的智能眼鏡類穿戴設備。多方信息顯示,蘋果計劃于 2027 年推出對標 Meta Ray-Bans 的 AI 眼鏡,同期或將發布搭載攝像頭的 AirPods 設備。kLR28資訊網——每日最新資訊28at.com

FastVLM 的本地化處理能力可有效支持此類設備脫離云端實現實時視覺交互。查詢獲悉,MLX 框架允許開發者在 Apple 設備本地訓練和運行模型,同時兼容主流 AI 開發語言。FastVLM 的推出證實蘋果正構建完整的端側 AI 技術生態。kLR28資訊網——每日最新資訊28at.com

參考資料:kLR28資訊網——每日最新資訊28at.com

https://github.com/apple/ml-fastvlm?tab=readme-ov-filekLR28資訊網——每日最新資訊28at.com

[2412.13303] FastVLM: Efficient Vision Encoding for Vision Language ModelskLR28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12845-0.html蘋果發布 FastVLM 視覺語言模型,為新型智能眼鏡等穿戴設備鋪路

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: SDS 技術首次用于音頻:英偉達攜手 MIT 推 Audio-SDS,參數化控制 AI 音效生成

下一篇: OpenAI 高管:AI 未來可自主生成知識,商業與科研迎來革命

標簽:
  • 熱門焦點
  • FMIFAwards獎項即將揭曉!

    來源:X增強現實FMIF Awards未來元宇宙創新獎是由未來元宇宙創新論壇、ARinChina以及多家投資機構、媒體、研究院聯合發起的一項評選活動。旨在推動新技術的融合與集成低成本
  • 三院士三教授熱聊元宇宙&——AIGC,學術界怎么看?

    來源:清元宇宙在近日舉辦的中國江寧2023元宇宙產業·人才高峰論壇暨AIGC發展大會上,中國工程院院士譚建榮、劉韻潔、鄭緯民出席并發表了主旨演講。除了三
  • Layer1的新以太坊,更好的以太坊?

    以太坊作為區塊鏈基礎設施地位看起來已不可動搖,但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
  • Meta證實Quest 2無法實現全身追蹤,未來將為虛擬化身配備“假腿”

    上周,外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項,暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中,Meta Reali
  • 以太坊升級將會帶來的5個改變

    以太坊自2015年誕生以來就廣受歡迎,但最近其昂貴的交易費用和低可擴展性對執行復雜的應用程序產生了負面作用,用戶對以太坊改進的需求也日益急迫。以太坊2.0已進
  • 與元宇宙美少女藝術家的對話

    我最近宣布了我自己的NFT項目,這是我已經工作了幾個月的事情。由于我之前只是一個收藏家,擁有自己的項目真的給了我一個新的視角來看待這個領域。我一直歡迎人們
  • NFT自動售貨機來啦!

    “紐約市有一臺售賣 Solana NFT 的自動售貨機,用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT,無需使用加密貨幣。由于基于 Solana 鏈的 N
  • 新聞業在元宇宙的現狀和未來

    “美聯社有毛病吧,這真的過分了!”,一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一,之后取消了此次銷售,因為該視頻呈現了移民穿越地中海的苦
  • 我們為什么需要Web3,距離Web3的實現還有多遠?

    當今技術正在經歷著重要的變革,許多公司正在改變他們的經營模式以求變得更加的靈活,其中有很大一部分公司采用了不同的方式來發展自己的業務。其中之一就是Web3,
Top 主站蜘蛛池模板: 蒙阴县| 遂昌县| 开化县| 台安县| 呼图壁县| 肇源县| 阳西县| 峡江县| 黄冈市| 潢川县| 长海县| 枣阳市| 司法| 黄龙县| 南昌县| 黎城县| 连州市| 东乌| 东阳市| 黄龙县| 轮台县| 福建省| 灌阳县| 吐鲁番市| 阜南县| 潮州市| 许昌市| 什邡市| 贵州省| 韩城市| 顺义区| 绵阳市| 贵溪市| 泰兴市| 伊金霍洛旗| 芮城县| 深水埗区| 溧水县| 华亭县| 开阳县| 涞源县|