6 月 6 日消息,字節跳動 Seed 團隊今日宣布發布圖像編輯模型 SeedEdit 3.0,目前已經在即夢網頁端開啟測試,豆包 App 也即將上線。
依靠 AI 完成指令式圖像編輯的需求,廣泛存在于視覺內容創意工作中。但此前,圖像編輯模型在主體 & 背景保持、指令遵循等方面能力相對有限,導致編輯圖像可用率不高。
據字節跳動官方介紹,SeedEdit 3.0 基于文生圖模型 Seedream 3.0,疊加多樣化的數據融合方法與特定獎勵模型,較好地解決了上述難題。其圖像主體、背景和細節保持能力進一步提升,尤其在人像編輯、背景更改、視角與光線轉換等場景表現較為突出。
該模型可處理并生成 4K 圖像,在精細且自然地處理編輯區域的同時,還能高保真地維持其他信息。尤其針對圖像編輯“哪里改與哪里不改”的取舍,該模型表現出更佳的理解力和權衡力,可用率相應提高。當用戶需要去掉圖片內一眾行人,模型不僅可以準確識別并移除場景內的無關人物,連影子也能一并去掉。
在 2D 繪畫轉為真實模特的任務中,SeedEdit 3.0 較好地保持了人物的衣帽穿搭與手提包等細節,生成圖片兼具時尚街拍感。
整個場景的光影變換,模型也可以處理得絲滑、自然。從近處房屋,到遠處海水波紋,細節均能合理保留下來,并跟隨光線變化,進行“像素級”的渲染調整。
為了實現上述能力,團隊在 SeedEdit 3.0 的研發工作中提出了一種高效的數據融合策略,并構建了多種專用獎勵模型。
通過將這些獎勵模型與擴散模型聯合訓練,團隊針對性地改善了關鍵任務的編輯質量(如人臉對齊、文本渲染等)。實際落地中,我們也對推理加速進行了同步優化。
字節跳動表示,除進一步優化編輯性能外,未來團隊還將探索更豐富的編輯操作,讓模型擁有連續多圖生成、多張圖像合成、故事性內容生成等能力。
附鏈接如下:
項目主頁:https://seed.bytedance.com/seededit
技術報告:https://arxiv.org/ pdf/2506.05083
本文鏈接:http://www.www897cc.com/showinfo-45-13571-0.html字節跳動發布圖像編輯模型 SeedEdit 3.0,處理更加絲滑高效
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com