日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 元宇宙 > AI

字節 Seed 開源統一多模態理解和生成模型 BAGEL

來源: 責編: 時間:2025-06-04 16:57:15 18觀看
導讀 6 月 3 日消息,字節跳動 Seed 團隊上周宣布開源統一多模態理解和生成模型 BAGEL,該模型支持文本、圖像和視頻的統一理解和生成。BAGEL 具有 70 億個激活參數(總共 140 億個),并在大規模交錯多模態數據上進行訓練。

6 月 3 日消息,字節跳動 Seed 團隊上周宣布開源統一多模態理解和生成模型 BAGEL,該模型支持文本、圖像和視頻的統一理解和生成。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

BAGEL 具有 70 億個激活參數(總共 140 億個),并在大規模交錯多模態數據上進行訓練。BAGEL 在標準多模態理解排行榜上超越了當前頂級的開源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了與專業生成器如 SD3 競爭的文本到圖像質量。E3O28資訊網——每日最新資訊28at.com

此外,BAGEL 在經典的圖像編輯場景中展示了比領先的開源模型更好的定性結果。更重要的是,它擴展到了自由形式的視覺操作、多視圖合成和世界導航,這些能力構成了超出以往圖像編輯模型范圍的“世界建模”任務。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

具體來看,BAGEL 基于大語言模型進行訓練,具備基礎的推理和對話能力,能夠處理圖像和文本的混合輸入,并以混合格式輸出。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

▲混合輸入-混合輸出

BAGEL 可生成較高質量、逼真的圖像、視頻或圖文交錯的內容。此外,還引入了長思維鏈 COT(Chain-of-Thought)模式,模型在生成之前可先“思考”。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

▲BAGEL 通過“思考”生成了一個穿著毛衣的鱷魚玩偶

基于交錯的多模態數據預訓練,BAGEL 自然地學會了保留視覺特征和細微細節,并且能從視頻中捕捉復雜的視覺運動,這些能力使得 BAGEL 在圖像編輯上更為高效。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

▲基于同一人物形象進行圖像編輯

基于對視覺內容和風格的理解,BAGEL 僅使用較少的對齊數據,即可實現圖片的風格切換,甚至還可轉換至不同場景中。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

▲BAGEL 實現多種風格遷移

此外,BAGEL 還具備世界模型的基礎能力,可實現世界導航、未來幀預測、3D 世界生成等更具挑戰性的任務,并進行不同角度的旋轉或視角切換。同時,BAGEL 還具備較強的泛化能力,不僅在各類真實場景中,還能在游戲、藝術作品、卡通動畫等場景中實現導航。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

基于以上能力,BAGEL 還可通過一個統一的多模態接口,實現各項能力的復雜組合,進行多輪對話。E3O28資訊網——每日最新資訊28at.com

E3O28資訊網——每日最新資訊28at.com

▲圖片剪切-智能編輯-場景轉換-風格轉換組合功能

附 BAGEL 開源地址:E3O28資訊網——每日最新資訊28at.com

官網及體驗入口:E3O28資訊網——每日最新資訊28at.com

https://seed.bytedance.com/bagelE3O28資訊網——每日最新資訊28at.com

GitHub 代碼:E3O28資訊網——每日最新資訊28at.com

https://github.com/bytedance-seed/BAGELE3O28資訊網——每日最新資訊28at.com

模型權重:E3O28資訊網——每日最新資訊28at.com

https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoTE3O28資訊網——每日最新資訊28at.com

研究論文:E3O28資訊網——每日最新資訊28at.com

https://arxiv.org/pdf/2505.14683E3O28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-45-13401-0.html字節 Seed 開源統一多模態理解和生成模型 BAGEL

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 任天堂《塞爾達傳說》手機伴侶應用被指使用生成式 AI 配音

下一篇: OpenAI 更新編程工具 Codex:新增語音輸入 + 聯網,向 ChatGPT Plus 用戶開放

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 犍为县| 扶风县| 永嘉县| 农安县| 濮阳市| 颍上县| 鄄城县| 阿克苏市| 焉耆| 开化县| 克拉玛依市| 慈溪市| 新泰市| 吴堡县| 灵武市| 漳平市| 洪雅县| 贞丰县| 金堂县| 闵行区| 黄山市| 连城县| 集贤县| 崇义县| 手机| 榕江县| 额济纳旗| 沁水县| 永修县| 浏阳市| 剑阁县| 乐山市| 通辽市| 丹江口市| 苍南县| 天津市| 罗江县| 辽宁省| 毕节市| 牙克石市| 桐城市|