日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

Hugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

來源: 責編: 時間:2025-01-28 08:57:22 75觀看
導讀 1 月 26 日消息,Hugging Face 發布了兩款全新多模態模型SmolVLM-256M和SmolVLM-500M,其中SmolVLM-256M號稱是世界上最小的視覺語言模型(Video Language Model)。據悉,相應模型主要基于 Hugging Face團隊去年訓練的

1 月 26 日消息,Hugging Face 發布了兩款全新多模態模型SmolVLM-256M和SmolVLM-500M,其中SmolVLM-256M號稱是世界上最小的視覺語言模型(Video Language Model)。Rb528資訊網——每日最新資訊28at.com

Rb528資訊網——每日最新資訊28at.com

據悉,相應模型主要基于 Hugging Face團隊去年訓練的 80B參數模型蒸餾而成,號稱在性能和資源需求之間實現了平衡,官方稱 SmolVLM-256M / 500M 兩款模型均可“開箱即用”,可以直接部署在transformer MLX和ONNX平臺上。Rb528資訊網——每日最新資訊28at.com

Rb528資訊網——每日最新資訊28at.com

具體技術層面,SmolVLM-256M / 500M 兩款模型均采用SigLIP作為圖片編碼器,使用 SmolLM2作為文本編碼器。其中 SmolVLM-256M是目前最小的多模態模型,可以接受任意序列的圖片和文本輸入并生成文字輸出,該模型功能包括描述圖片內容、為短視頻生成字幕、處理PDF 等。Hugging Face 稱由于該模型整體輕巧,可在移動平臺輕松運行,僅需不到1GB的GPU顯存便可在單張圖片上完成推理。Rb528資訊網——每日最新資訊28at.com

而 SmolVLM-500M針對需要更高性能的場景而設計,Hugging Face稱相關模型非常適合部署在企業運營環境中,該模型推理單張圖片僅需1.23GB的GPU顯存,相對 SmolVLM-256M 雖然負載更大,但推理輸出的內容更精準。Rb528資訊網——每日最新資訊28at.com

Rb528資訊網——每日最新資訊28at.com

注意到,兩款模型均采用Apache 2.0開源授權,研究團隊提供了基于transformer和WebGUI的示例程序。所有模型及其演示已公開便于開發者下載和使用,具體頁面可(點此訪問)。Rb528資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-10215-0.htmlHugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 谷歌希望更多人、行業了解 AI,力求塑造公眾認知

下一篇: 百川智能上線開源全模態模型 Omni-1.5,號稱多項能力超越 GPT-4o mini

標簽:
  • 熱門焦點
  • FMIFAwards獎項即將揭曉!

    來源:X增強現實FMIF Awards未來元宇宙創新獎是由未來元宇宙創新論壇、ARinChina以及多家投資機構、媒體、研究院聯合發起的一項評選活動。旨在推動新技術的融合與集成低成本
  • 沉寂3年,大模型激活小度天貓精靈?

    Tech星球(微信ID:tech618)文 | 何煦陽 沉寂了許久的智能音箱,在今年大模型橫空出世之后,又再次燃起了新的希望。 2月9日,小度宣布將融合文心一言,打造針對智能設備場景的AI模型&ldq
  • 全面擁抱“虛擬世界”,摩登天空要打造“音樂元宇宙”

    作者:袁佳琦沈黎暉不怎么打游戲,但許多事兒在他眼里都“有意思”。好玩,有意思,是他的口頭禪,在接受娛樂獨角獸的采訪過程中,他多次提到,做虛擬音樂人,“是件挺好玩的
  • 影響元宇宙土地價格的五個因素

    參考來源 | cryptonews編譯 | Ciel@iNFTnews.com元宇宙中的房地產價格主要取決于使用它的人數,以及為所有者創造收益的能力。專注于數字資產的投資公司LedgerPr
  • 新聞業在元宇宙的現狀和未來

    “美聯社有毛病吧,這真的過分了!”,一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一,之后取消了此次銷售,因為該視頻呈現了移民穿越地中海的苦
  • 融資千萬美元的元宇宙平臺UGC到底是什么?

    據獲悉,全球化元宇宙社交平臺BUD Technologies, Inc.(以下簡稱“BUD”)宣布完成1500萬美元A+輪融資,本輪融資由啟明創投領投,老股東源碼資本、GGV紀源資本、云九資
  • 從NFT數字收藏,洞察數字音樂版權市場發展趨勢

    去年8月9日,騰訊音樂布局NFT數字收藏,在騰訊應用寶發布幻核app,騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
  • Ceramic:為Web3.0社交應用打造的中間件

    大家關注老雅痞公眾號這么久,對Web3的概念不陌生吧?讓我們做一個簡短的回顧,Web3主要被描述為去中心化的網絡,旨在實現無服務器、去中心化的互聯網,即用戶掌握自己
  • 售出6930萬美元的NFT已經過去一年,NFT如今是否已成為主流?

    Everydays: the First 5000 Days/Beeple去年三月,一件藝術品被著名拍賣行佳士得以6930萬美元的高價售出。而讓人們感到震驚的是,這個拍賣作品不是出自哪位藝術大
Top 主站蜘蛛池模板: 肥乡县| 乌什县| 会东县| 蓬溪县| 北川| 房产| 高密市| 察哈| 安化县| 左权县| 星子县| 香格里拉县| 治多县| 柏乡县| 繁峙县| 克什克腾旗| 和龙市| 遂平县| 聂拉木县| 新和县| 博客| 东兰县| 泰安市| 新昌县| 巢湖市| 响水县| 和政县| 白朗县| 四川省| 鄄城县| 开原市| 咸阳市| 连江县| 海兴县| 平远县| 轮台县| 大邑县| 甘谷县| 泰顺县| 邻水| 姚安县|