日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁 > 科技  > 資訊

智源發(fā)布Emu3:原生多模態(tài)世界模型,能否一統(tǒng)圖像文本視頻?

來源: 責(zé)編: 時間:2024-10-22 08:07:51 68觀看
導(dǎo)讀【ITBEAR】智源研究院近期推出了全新的原生多模態(tài)世界模型——Emu3,該模型在文本、圖像和視頻三種模態(tài)數(shù)據(jù)的理解和生成上展現(xiàn)出卓越能力。其獨(dú)特之處在于,僅需基于下一個token預(yù)測,無需依賴擴(kuò)散模型或組合方法,便能實(shí)現(xiàn)

【ITBEAR】智源研究院近期推出了全新的原生多模態(tài)世界模型——Emu3,該模型在文本、圖像和視頻三種模態(tài)數(shù)據(jù)的理解和生成上展現(xiàn)出卓越能力。其獨(dú)特之處在于,僅需基于下一個token預(yù)測,無需依賴擴(kuò)散模型或組合方法,便能實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的統(tǒng)一處理。Jgt28資訊網(wǎng)——每日最新資訊28at.com

Jgt28資訊網(wǎng)——每日最新資訊28at.com

在圖像生成任務(wù)中,Emu3的表現(xiàn)優(yōu)于SD-1.5與SDXL模型,獲得了人類偏好評測的高度認(rèn)可。同時,在視覺語言理解任務(wù)中,Emu3也展現(xiàn)出了強(qiáng)大的實(shí)力,其對于12項(xiàng)基準(zhǔn)測試的平均得分超越了LlaVA-1.6。在視頻生成任務(wù)中,Emu3同樣表現(xiàn)出色,VBench基準(zhǔn)測試得分高于OpenSora 1.2。Jgt28資訊網(wǎng)——每日最新資訊28at.com

Emu3配備了一個強(qiáng)大的視覺tokenizer,能夠?qū)⒁曨l和圖像轉(zhuǎn)換為離散token,這些token可以與文本tokenizer輸出的離散token一同送入模型中。這一特性為Any-to-Any任務(wù)提供了更加統(tǒng)一的研究范式。Jgt28資訊網(wǎng)——每日最新資訊28at.com

Jgt28資訊網(wǎng)——每日最新資訊28at.com

Emu3的研究結(jié)果充分證明了下一個token預(yù)測作為多模態(tài)模型范式的強(qiáng)大潛力,它不僅能實(shí)現(xiàn)超越語言本身的大規(guī)模多模態(tài)學(xué)習(xí),還能在多模態(tài)任務(wù)中取得先進(jìn)性能。目前,Emu3已開源關(guān)鍵技術(shù)和模型,為相關(guān)研究提供了有力支持。Jgt28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-16-126514-0.html智源發(fā)布Emu3:原生多模態(tài)世界模型,能否一統(tǒng)圖像文本視頻?

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 中國PCT國際專利申請量:連續(xù)五年穩(wěn)坐全球榜首!

下一篇: 索泰辟謠:印尼工廠未量產(chǎn)RTX 5090,視頻實(shí)為4070 Ti Super

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 主站蜘蛛池模板: 镇巴县| 从江县| 蓬莱市| 合肥市| 安西县| 玉门市| 滕州市| 读书| 冕宁县| 浙江省| 滦南县| 梅河口市| 崇阳县| 固阳县| 凤台县| 吉隆县| 云龙县| 阿勒泰市| 白银市| 泰来县| 和林格尔县| 咸阳市| 葵青区| 拉孜县| 京山县| 四川省| 县级市| 年辖:市辖区| 张家港市| 武胜县| 蛟河市| 丹巴县| 龙游县| 佛学| 古蔺县| 敦煌市| 永春县| 米易县| 合水县| 东乌珠穆沁旗| 隆昌县|