6 月 6 日消息,字節(jié)跳動(dòng) Seed 團(tuán)隊(duì)今日宣布發(fā)布圖像編輯模型 SeedEdit 3.0,目前已經(jīng)在即夢(mèng)網(wǎng)頁(yè)端開(kāi)啟測(cè)試,豆包 App 也即將上線。
依靠 AI 完成指令式圖像編輯的需求,廣泛存在于視覺(jué)內(nèi)容創(chuàng)意工作中。但此前,圖像編輯模型在主體 & 背景保持、指令遵循等方面能力相對(duì)有限,導(dǎo)致編輯圖像可用率不高。
據(jù)字節(jié)跳動(dòng)官方介紹,SeedEdit 3.0 基于文生圖模型 Seedream 3.0,疊加多樣化的數(shù)據(jù)融合方法與特定獎(jiǎng)勵(lì)模型,較好地解決了上述難題。其圖像主體、背景和細(xì)節(jié)保持能力進(jìn)一步提升,尤其在人像編輯、背景更改、視角與光線轉(zhuǎn)換等場(chǎng)景表現(xiàn)較為突出。
該模型可處理并生成 4K 圖像,在精細(xì)且自然地處理編輯區(qū)域的同時(shí),還能高保真地維持其他信息。尤其針對(duì)圖像編輯“哪里改與哪里不改”的取舍,該模型表現(xiàn)出更佳的理解力和權(quán)衡力,可用率相應(yīng)提高。當(dāng)用戶需要去掉圖片內(nèi)一眾行人,模型不僅可以準(zhǔn)確識(shí)別并移除場(chǎng)景內(nèi)的無(wú)關(guān)人物,連影子也能一并去掉。
在 2D 繪畫(huà)轉(zhuǎn)為真實(shí)模特的任務(wù)中,SeedEdit 3.0 較好地保持了人物的衣帽穿搭與手提包等細(xì)節(jié),生成圖片兼具時(shí)尚街拍感。
整個(gè)場(chǎng)景的光影變換,模型也可以處理得絲滑、自然。從近處房屋,到遠(yuǎn)處海水波紋,細(xì)節(jié)均能合理保留下來(lái),并跟隨光線變化,進(jìn)行“像素級(jí)”的渲染調(diào)整。
通過(guò)將這些獎(jiǎng)勵(lì)模型與擴(kuò)散模型聯(lián)合訓(xùn)練,團(tuán)隊(duì)針對(duì)性地改善了關(guān)鍵任務(wù)的編輯質(zhì)量(如人臉對(duì)齊、文本渲染等)。實(shí)際落地中,我們也對(duì)推理加速進(jìn)行了同步優(yōu)化。
字節(jié)跳動(dòng)表示,除進(jìn)一步優(yōu)化編輯性能外,未來(lái)團(tuán)隊(duì)還將探索更豐富的編輯操作,讓模型擁有連續(xù)多圖生成、多張圖像合成、故事性內(nèi)容生成等能力。
附鏈接如下:
項(xiàng)目主頁(yè):https://seed.bytedance.com/seededit
技術(shù)報(bào)告:https://arxiv.org/ pdf/2506.05083
本文鏈接:http://www.www897cc.com/showinfo-45-13571-0.html字節(jié)跳動(dòng)發(fā)布圖像編輯模型 SeedEdit 3.0,處理更加絲滑高效
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 谷歌 Gemini 上線“計(jì)劃操作”功能:動(dòng)動(dòng)手就能讓“AI 秘書(shū)”幫你完成任務(wù)
下一篇: 2025 世界人形機(jī)器人運(yùn)動(dòng)會(huì)開(kāi)啟報(bào)名,8 月 15 日北京開(kāi)幕