當前位置：首頁 > 元宇宙 > AI

Hugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

來源：責編：時間：2025-01-28 08:57:22 75觀看

導讀 1 月 26 日消息，Hugging Face 發布了兩款全新多模態模型SmolVLM-256M和SmolVLM-500M，其中SmolVLM-256M號稱是世界上最小的視覺語言模型（Video Language Model）。據悉，相應模型主要基于 Hugging Face團隊去年訓練的

1 月 26 日消息，Hugging Face 發布了兩款全新多模態模型SmolVLM-256M和SmolVLM-500M，其中SmolVLM-256M號稱是世界上最小的視覺語言模型（Video Language Model）。

據悉，相應模型主要基于 Hugging Face團隊去年訓練的 80B參數模型蒸餾而成，號稱在性能和資源需求之間實現了平衡，官方稱 SmolVLM-256M / 500M 兩款模型均可“開箱即用”，可以直接部署在transformer MLX和ONNX平臺上。

具體技術層面，SmolVLM-256M / 500M 兩款模型均采用SigLIP作為圖片編碼器，使用 SmolLM2作為文本編碼器。其中 SmolVLM-256M是目前最小的多模態模型，可以接受任意序列的圖片和文本輸入并生成文字輸出，該模型功能包括描述圖片內容、為短視頻生成字幕、處理PDF 等。Hugging Face 稱由于該模型整體輕巧，可在移動平臺輕松運行，僅需不到1GB的GPU顯存便可在單張圖片上完成推理。

而 SmolVLM-500M針對需要更高性能的場景而設計，Hugging Face稱相關模型非常適合部署在企業運營環境中，該模型推理單張圖片僅需1.23GB的GPU顯存，相對 SmolVLM-256M 雖然負載更大，但推理輸出的內容更精準。

注意到，兩款模型均采用Apache 2.0開源授權，研究團隊提供了基于transformer和WebGUI的示例程序。所有模型及其演示已公開便于開發者下載和使用，具體頁面可（點此訪問）。

本文鏈接：http://www.www897cc.com/showinfo-45-10215-0.htmlHugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌希望更多人、行業了解 AI，力求塑造公眾認知

下一篇：百川智能上線開源全模態模型 Omni-1.5，號稱多項能力超越 GPT-4o mini

標簽：

熱門焦點

FMIFAwards獎項即將揭曉！

來源：X增強現實FMIF Awards未來元宇宙創新獎是由未來元宇宙創新論壇、ARinChina以及多家投資機構、媒體、研究院聯合發起的一項評選活動。旨在推動新技術的融合與集成低成本
沉寂3年，大模型激活小度天貓精靈？

Tech星球（微信ID：tech618）文 | 何煦陽沉寂了許久的智能音箱，在今年大模型橫空出世之后，又再次燃起了新的希望。 2月9日，小度宣布將融合文心一言，打造針對智能設備場景的AI模型&ldq
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
影響元宇宙土地價格的五個因素

參考來源 | cryptonews編譯 | Ciel@iNFTnews.com元宇宙中的房地產價格主要取決于使用它的人數，以及為所有者創造收益的能力。專注于數字資產的投資公司LedgerPr
新聞業在元宇宙的現狀和未來

“美聯社有毛病吧，這真的過分了！”，一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一，之后取消了此次銷售，因為該視頻呈現了移民穿越地中海的苦
融資千萬美元的元宇宙平臺UGC到底是什么？

據獲悉，全球化元宇宙社交平臺BUD Technologies, Inc.（以下簡稱“BUD”）宣布完成1500萬美元A+輪融資，本輪融資由啟明創投領投，老股東源碼資本、GGV紀源資本、云九資
從NFT數字收藏，洞察數字音樂版權市場發展趨勢

去年8月9日，騰訊音樂布局NFT數字收藏，在騰訊應用寶發布幻核app，騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
Ceramic：為Web3.0社交應用打造的中間件

大家關注老雅痞公眾號這么久，對Web3的概念不陌生吧？讓我們做一個簡短的回顧，Web3主要被描述為去中心化的網絡，旨在實現無服務器、去中心化的互聯網，即用戶掌握自己
售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

Everydays: the First 5000 Days/Beeple去年三月，一件藝術品被著名拍賣行佳士得以6930萬美元的高價售出。而讓人們感到震驚的是，這個拍賣作品不是出自哪位藝術大

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

Hugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

FMIFAwards獎項即將揭曉！

沉寂3年，大模型激活小度天貓精靈？

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

影響元宇宙土地價格的五個因素

新聞業在元宇宙的現狀和未來

融資千萬美元的元宇宙平臺UGC到底是什么？

從NFT數字收藏，洞察數字音樂版權市場發展趨勢

Ceramic：為Web3.0社交應用打造的中間件

售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

最新推薦

歐盟人工智能法案：四種AI系統風險類型的劃分及監管措施

一份全面清單：Web3行業高薪酬的13種工作

2022年6款最佳的NFT稀有度查詢工具

從虛擬餐廳到虛擬時裝秀，行業巨頭掀起元宇宙商標注冊潮

技術賦能，國內首家寵物元宇宙平臺“Pet Meta”開啟虛擬養寵新方式

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

猜你喜歡

熱門推薦

相關資訊