日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

谷歌 DeepMind 發布 WebLI-100B:千億級數據集解鎖 AI 視覺語言模型的文化多樣性

來源: 責編: 時間:2025-02-16 08:41:35 72觀看
導讀 2 月 14 日消息,科技媒體 marktechpost 昨日(2 月 13 日)發布博文,報道稱谷歌 DeepMind 團隊發布了 WebLI-100B 千億級數據集,并通過增強文化多樣性和多語言性,以及減少子組之間的性能差異來提高包容性。目前挑戰注

2 月 14 日消息,科技媒體 marktechpost 昨日(2 月 13 日)發布博文,報道稱谷歌 DeepMind 團隊發布了 WebLI-100B 千億級數據集,并通過增強文化多樣性和多語言性,以及減少子組之間的性能差異來提高包容性。48y28資訊網——每日最新資訊28at.com

目前挑戰

注:機器通過學習大型數據集來連接圖像和文本,數據越多,模型識別模式和提高準確性的能力就越強。視覺語言模型 (VLMs) 依賴這些數據集執行圖像字幕和視覺問答等任務。48y28資訊網——每日最新資訊28at.com

視覺語言模型目前依賴于 Conceptual Captions 和 LAION 等大型數據集,包含數百萬到數十億的圖像-文本對。這些數據集支持零樣本分類和圖像字幕生成,但其發展已放緩至約 100 億對。48y28資訊網——每日最新資訊28at.com

這種限制降低了進一步提高模型精度、包容性和多語言理解的前景,現有方法基于網絡爬取的數據,存在樣本質量低、語言偏差和多元文化代表性不足等問題。48y28資訊網——每日最新資訊28at.com

WebLI-100B 千億級數據集

Google DeepMind 的研究人員為了緩解視覺語言模型在文化多樣性和多語言性方面的局限性,提出了 WebLI-100B 數據集,該數據集包含 1000 億個圖像-文本對,比之前的數據集大十倍。48y28資訊網——每日最新資訊28at.com

該數據集捕獲了罕見的文化概念,并提高了模型在低資源語言和多樣化表示等較少探索領域的性能。與先前的數據集不同,WebLI-100B 不是依賴嚴格的過濾(通常會刪除重要的文化細節),而是專注于擴展數據。48y28資訊網——每日最新資訊28at.com

該框架涉及在 WebLI-100B 數據集的不同子集(1B、10B 和 100B)上預訓練模型,以分析數據縮放的影響。48y28資訊網——每日最新資訊28at.com

在完整數據集上訓練的模型在文化和多語言任務中的表現優于在較小數據集上訓練的模型,即使使用相同的計算資源。該數據集沒有進行激進的過濾,而是保留了語言和文化元素的廣泛代表性,使其更具包容性。48y28資訊網——每日最新資訊28at.com

研究結果表明,將數據集大小從 10B 增加到 100B 對以西方為中心的基準測試的影響很小,但在文化多樣性任務和低資源語言檢索方面帶來了改進。48y28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-10809-0.html谷歌 DeepMind 發布 WebLI-100B:千億級數據集解鎖 AI 視覺語言模型的文化多樣性

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 兩輪電動車行業首個,九號將深度融合 DeepSeek 大模型

下一篇: 英國政府同 Anthropic 深化合作:Claude 有望增強該國公共服務能力

標簽:
  • 熱門焦點
  • 錯過了BRC20還有eths,eth銘文協議

    來源:三頭鳥NFT大家好,我是鳥哥,了解鳥哥的人都知道鳥哥擅擼空投,說實話擼毛雖然回報大但周期還是有點長的,所以除了擼毛我們自己也在研究早期項目,打新,比如BRC20協議ordi當時就有
  • 虛擬人再升級,企業可以解放雙手了?

    來源:伯虎財經今天想跟大家來嘮嘮AI,其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后,還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
  • 挖來Meta AR高管,難道蘋果也要進軍元宇宙?

    “被曝光”的才是最吸引人的產品,相信有關注過蘋果硬件消息的朋友們都明白這樣的道理。往近了說有蘋果“即將發布”的iPhone SE 3和M2芯片,往遠了說有“折疊屏iP
  • 韓國主權基金增加對硅谷初創公司投資 押注元宇宙和人工智能

    韓國投資公司(KIC)CEO Seoungho Jin預計,該公司在舊金山的辦事處今年將擴招人手,探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
  • 中國區塊鏈產業生態地圖報告(2021)

    區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新,以服務實體經濟、政務民生以及公共服務等領域為落腳點,以期實現整個地區和產業的資
  • 2022年最具關注的9個頭像NFT項目

    什么是 PFP NFT 項目?PFP NFT (個人資料圖片NFT)是一組獨特的數字收藏品,人們用來在互聯網平臺上代表自己。這些數字藝術作品通常是一系列可作為頭像的角色,在 Twit
  • 音樂家如何利用NFTs來提高歌迷參與度

    "音樂是一種語言,不以特定的文字說話。它用情感說話,如果它在骨子里,它就在骨子里。" - Keith Richards音樂激勵著我們,使我們流淚,使我們充滿狂喜,并撫慰我們的靈魂
  • 融資千萬美元的元宇宙平臺UGC到底是什么?

    據獲悉,全球化元宇宙社交平臺BUD Technologies, Inc.(以下簡稱“BUD”)宣布完成1500萬美元A+輪融資,本輪融資由啟明創投領投,老股東源碼資本、GGV紀源資本、云九資
  • 從概念到落地 Web3.0初具雛形

    加密資產熱潮催生出的鏈上應用中,除了DeFi、NFT、鏈游GameFi等場景外,還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年,由以太坊聯合創始人及波卡創建者
Top 主站蜘蛛池模板: 石景山区| 乌兰浩特市| 昌都县| 永仁县| 永平县| 东安县| 台东市| 定兴县| 九龙县| 于都县| 婺源县| 麻栗坡县| 郑州市| 康平县| 景洪市| 中山市| 金秀| 汉寿县| 乌拉特前旗| 辽阳县| 南陵县| 中江县| 泽普县| 崇文区| 旌德县| 望谟县| 鄯善县| 山东| 三河市| 定襄县| 大兴区| 青海省| 龙江县| 郓城县| 姜堰市| 积石山| 银川市| 全南县| 东乡族自治县| 雷波县| 互助|