日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

谷歌發布 Mirasol:30 億參數,將多模態理解擴展到長視頻

來源: 責編: 時間:2023-11-20 17:10:26 334觀看
導讀 11 月 16 日消息,谷歌公司近日發布新聞稿,介紹了小型人工智能模型 Mirasol,可以回答有關視頻的問題并創造新的記錄。AI 模型目前很難處理不同的數據流,如果要讓 AI 理解視頻,需要整合視頻、音頻和文本等不同模態的

11 月 16 日消息,谷歌公司近日發布新聞稿,介紹了小型人工智能模型 Mirasol,可以回答有關視頻的問題并創造新的記錄。4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

AI 模型目前很難處理不同的數據流,如果要讓 AI 理解視頻,需要整合視頻、音頻和文本等不同模態的信息,這大大增加了難度。4bC28資訊網——每日最新資訊28at.com

谷歌和谷歌 Deepmind 的研究人員提出了新的方法,將多模態理解擴展到長視頻領域。4bC28資訊網——每日最新資訊28at.com

借助 Mirasol AI 模型,該團隊試圖解決兩個關鍵挑戰:4bC28資訊網——每日最新資訊28at.com

需要以高頻采樣同步視頻和音頻,但要異步處理標題和視頻描述。4bC28資訊網——每日最新資訊28at.com

視頻和音頻會生成大量數據,這會讓模型的容量緊張。4bC28資訊網——每日最新資訊28at.com

谷歌在 Mirasol 中使用合路器(combiners)和自回歸轉換器(autoregressive transformer)模型。4bC28資訊網——每日最新資訊28at.com

該模型組件會處理時間同步的視頻和音頻信號,然后再將視頻拆分為單獨的片段。4bC28資訊網——每日最新資訊28at.com

轉換器處理每個片段,并學習每個片段之間的聯系,然后使用另一個轉換器處理上下文文本,這兩個組件交換有關其各自輸入的信息。4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

名為 Combiner 的新穎轉換模塊從每個片段中提取通用表示,并通過降維來壓縮數據。每個段包含 4 到 64 幀,該模型當前共有 30 億個參數,可以處理 128 到 512 幀的視頻。4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

在測試中,Mirasol3B 在視頻問題分析方面達到了新的基準,體積明顯更小,并且可以處理更長的視頻。使用包含內存的組合器變體,該團隊可以將所需的計算能力進一步降低 18%。4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

4bC28資訊網——每日最新資訊28at.com

在此附上 Mirasol 的官方新聞稿,感興趣的用戶可以深入閱讀。4bC28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-2592-0.html谷歌發布 Mirasol:30 億參數,將多模態理解擴展到長視頻

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 浙江衛健委推出可陪診數字健康人“安診兒”:基于支付寶技術,可提供全流程陪伴

下一篇: TPC 聯盟成立:目標萬億以上參數 AI 模型,推進科學發現

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 太和县| 尼勒克县| 申扎县| 南澳县| 贡山| 曲麻莱县| 顺平县| 大悟县| 平舆县| 罗源县| 靖西县| 新绛县| 平定县| 门源| 浪卡子县| 乌苏市| 通河县| 甘德县| 洪泽县| 金溪县| 双鸭山市| 江阴市| 淳安县| 渝中区| 湖南省| 微山县| 翼城县| 阿合奇县| 洛南县| 广州市| 大竹县| 毕节市| 扶风县| 光山县| 华安县| 芷江| 密云县| 嘉义县| 松阳县| 衡阳市| 仁布县|