6 月 6 日消息,北京智源人工智能研究院今日發布“悟界”系列大模型,包括全球首個原生多模態世界模型“悟界?Emu3”、全球首個腦科學多模態通用基礎模型“悟界?見微 Brainμ”。
智源研究院還發布了悟界?具身智能大模型,包括全球首個支持 MCP 的跨本體大小腦協作框架悟界?RoboOS 2.0、具身大腦大模型悟界?RoboBrain 2.0 和全原子微觀生命模型悟界?OpenComplex2也一并發布。
去年 10 月,智源研究院發布了原生多模態世界模型 Emu3。據此前報道,該模型只基于下一個 token 預測,無需擴散模型或組合方法,即可完成文本、圖像、視頻三種模態數據的理解和生成。官方宣稱實現圖像、文本、視頻大一統。Emu3 支持多模態輸入、多模態輸出的端到端映射,驗證了自回歸框架在多模態領域的普適性與先進性,為跨模態交互提供了強大的技術基座。
見微 Brainμ 基于 Emu3 底層架構,將 fMRI、EEG、雙光子等神經科學與腦醫學相關的腦信號統一 token 化,利用預訓練模型多模態對齊的優勢,可以實現多模態腦信號與文本、圖像等模態的多向映射,并實現跨任務、跨模態、跨個體的統一通用建模,以單一模型完成多種神經科學的下游任務。
相關閱讀:
《智源發布原生多模態世界模型 Emu3,宣稱實現圖像、文本、視頻大一統》
本文鏈接:http://www.www897cc.com/showinfo-45-13532-0.html智源研究院發布“悟界”系列大模型,含全球首個原生多模態世界模型 Emu3
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com