日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

Meta 推 WebSSL 模型:探索 AI 無語言視覺學習,純圖訓練媲美 OpenAI CLIP

來源: 責編: 時間:2025-04-28 07:34:04 76觀看
導讀 4 月 25 日消息,科技媒體 marktechpost 昨日(4 月 24 日)發布博文,報道稱 Meta 公司發布 WebSSL 系列模型,參數規模從 3 億到 70 億,基于純圖像數據訓練,旨在探索無語言監督的視覺自監督學習(SSL)的潛力。以 OpenAI 的

4 月 25 日消息,科技媒體 marktechpost 昨日(4 月 24 日)發布博文,報道稱 Meta 公司發布 WebSSL 系列模型,參數規模從 3 億到 70 億,基于純圖像數據訓練,旨在探索無語言監督的視覺自監督學習(SSL)的潛力。3E328資訊網——每日最新資訊28at.com

以 OpenAI 的 CLIP 為代表,對比語言-圖像模型已成為學習視覺表征的默認選擇,在視覺問答(VQA)和文檔理解等多模態任務中表現突出。不過受到數據集獲取的復雜性和數據規模的限制,語言依賴面臨諸多挑戰。3E328資訊網——每日最新資訊28at.com

Meta 公司針對上述痛點,在在 Hugging Face 平臺上發布了 WebSSL 系列模型,涵蓋 DINO 和 Vision Transformer(ViT)架構,參數規模從 3 億到 70 億不等。3E328資訊網——每日最新資訊28at.com

3E328資訊網——每日最新資訊28at.com

這些模型僅使用 MetaCLIP 數據集(MC-2B)中的 20 億張圖像子集進行訓練,排除了語言監督的影響。Meta 的目標并非取代 CLIP,而是通過控制變量,深入評估在不受數據和模型規模限制下,純視覺自監督學習(SSL)的表現潛力。3E328資訊網——每日最新資訊28at.com

WebSSL 模型采用兩種視覺自監督學習范式:聯合嵌入學習(DINOv2)和掩碼建模(MAE)。訓練統一使用 224×224 分辨率圖像,并凍結視覺編碼器以確保結果差異僅源于預訓練策略。3E328資訊網——每日最新資訊28at.com

模型在五個容量層級(ViT-1B 至 ViT-7B)上訓練,評估基于 Cambrian-1 基準測試,覆蓋通用視覺理解、知識推理、OCR 和圖表解讀等 16 個 VQA 任務。此外,模型無縫集成于 Hugging Face 的 transformers 庫,便于研究和應用。3E328資訊網——每日最新資訊28at.com

實驗揭示了多項關鍵發現:隨著參數規模增加,WebSSL 模型在 VQA 任務上的表現接近對數線性提升,而 CLIP 在超過 30 億參數后性能趨于飽和。3E328資訊網——每日最新資訊28at.com

WebSSL 在 OCR 和圖表任務中表現尤為突出,尤其在數據篩選后,僅用 1.3% 的富文本圖像訓練即超越 CLIP,在 OCRBench 和 ChartQA 任務中提升高達 13.6%。3E328資訊網——每日最新資訊28at.com

3E328資訊網——每日最新資訊28at.com

此外,高分辨率(518px)微調進一步縮小了與 SigLIP 等高分辨率模型的差距,在文檔任務中表現尤為出色。3E328資訊網——每日最新資訊28at.com

WebSSL 模型在無語言監督下仍展現出與預訓練語言模型(如 LLaMA-3)的良好對齊性,表明大規模視覺模型能隱式學習與文本語義相關的特征。3E328資訊網——每日最新資訊28at.com

同時,WebSSL 在傳統基準測試(如 ImageNet-1k 分類、ADE20K 分割)上保持強勁表現,部分場景甚至優于 MetaCLIP 和 DINOv2。3E328資訊網——每日最新資訊28at.com

附上參考地址3E328資訊網——每日最新資訊28at.com

Scaling Language-Free Visual Representation Learning3E328資訊網——每日最新資訊28at.com

Hugging Face3E328資訊網——每日最新資訊28at.com

GitHub3E328資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-12655-0.htmlMeta 推 WebSSL 模型:探索 AI 無語言視覺學習,純圖訓練媲美 OpenAI CLIP

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AI 會有意識嗎?Anthropic 啟動新項目,探索尋求答案

下一篇: 黑洞超輻射:顛覆認知的量子奇觀,開啟宇宙探索新視角!

標簽:
  • 熱門焦點
  • 元媧2.7上線:虛擬人視頻制作速度瘋狂翻倍!

    來源:清元宇宙 炎炎夏日努力工作的Q仔的電腦都冒煙兒啦~今天要給大家介紹兩個新小伙伴——小元和小媧,他們將給大家解讀元媧2.7版本重磅更新內容~大家掌聲歡迎~~~本次更
  • 風口已至,多領域平臺融入社交元素!

    在眾多領域平臺中,社交元素都扮演著重要角色,如直播營銷帶貨、線上配對聽歌、游戲局內互動等。隨著元宇宙時代的來臨,社交產品不斷升級,社交元素推動流量變現,多平臺領域融入社交
  • 中文在線的“元宇宙”故事,資本聽膩了?

    被譽為“元宇宙”龍頭之一的中文在線,這下尷尬了。2022年1月11日,中國移動通信聯合會元宇宙產業委員會揭牌,接納涉足“元宇宙”的8家上市公司,包括中青寶、天下秀
  • 如何對一款 NFT 項目進行價值評估?

    原文作者 | Othmane Senhaji Rhazi,Web 3 企業家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導 Web3 和 NFT 領域的企業家,因為我相信我們正在見證社會
  • 區塊鏈產業人才發展報告

    工業和信息化部作為工業和信息化行業主管部門,正在著力推進“兩個強國”建設,加快推動以區塊鏈為代表的新興技術與實體經濟深度融合。我國區塊鏈技術和應用想要
  • 國內涌現70余家數字藏品平臺:合規、流量與利潤在博弈

    作者:楊鄭君2月16日,迅雷鏈企業數字藏品服務平臺正式上線,繼阿里、騰訊、京東、百度、網易等之后,又一家互聯網企業正式加入到火熱的數字藏品平臺的競爭中。除互聯
  • 元宇宙平臺會是上世紀末的互聯網嗎?

    “元宇宙”火了好幾個月,互聯網大廠忙于布局,資本市場熱烈追捧。然而很多人還是看不明白,更多的人覺得這是一場泡沫,一場騙局。一開始接觸這個怪里怪氣的名詞,感覺
  • 元宇宙收割了誰

    作者:曉宇資本將元宇宙看作下一代互聯網的門票,畫大餅、割韭菜就成了一大選項。2021年被稱為元宇宙元年。在這一年里,先是號稱元宇宙第一股的沙盒游戲Roblox盛裝
  • TX加入的NFT數字收藏品,元宇宙的破圈之路?

    3月7日,澳大利亞 NFT 初創公司 Immutable 在新加坡淡馬錫牽頭的R資中以估值 25 億美元完成2億美元R資,騰訊參投。想必國人最熟知的應該就是TX,作為國內四大互聯網
Top 主站蜘蛛池模板: 林口县| 兴国县| 台湾省| 徐水县| 普格县| 海晏县| 巴青县| 重庆市| 象州县| 青神县| 浏阳市| 瑞安市| 河北省| 万源市| 安吉县| 龙岩市| 察雅县| 尚义县| 团风县| 额济纳旗| 芮城县| 嫩江县| 西峡县| 浦东新区| 岳阳市| 太湖县| 井冈山市| 磐石市| 陈巴尔虎旗| 阜阳市| 清水县| 灌阳县| 开平市| 安溪县| 通化县| 当阳市| 汉沽区| 丰城市| 合作市| 汝州市| 平远县|