當前位置：首頁 > 元宇宙 > AI

一張圖 + 一句話實現任意角色場景姿勢，騰訊混元宣布開源定制化圖像生成插件 InstantCharacter

來源：責編：時間：2025-04-21 09:45:17 74觀看

導讀 4 月 18 日消息，騰訊混元今日宣布開源定制化圖像生成插件InstantCharacter，并實現了對開源文生圖模型 Flux 的兼容。騰訊官方介紹稱，通過這個插件，在大模型中，只需要一張圖加一句話，就可以讓任何角色以你想要的姿勢

4 月 18 日消息，騰訊混元今日宣布開源定制化圖像生成插件InstantCharacter，并實現了對開源文生圖模型 Flux 的兼容。

騰訊官方介紹稱，通過這個插件，在大模型中，只需要一張圖加一句話，就可以讓任何角色以你想要的姿勢出現在任何地方。

輸入原始圖片

+ prompt ：a rabbit is in the kitchen holding a spoon and drinking soup

就能得到下面的圖：

+prompt：a rabbit in the city,cyberpunk

就可以得到：

角色一致性是多輪文生圖場景中的一大難題。InstantCharacter 的優勢在于可以確保角色在不同場景中的一致性和真實性、畫質和精度高，同時具有靈活的文本編輯性，用戶可以根據需要靈活切換任意場景，讓人物生成任意動作。

其在角色一致性和圖像生成的精確度上號稱超過了此前業界的相關技術，能夠處理多種風格和復雜度的圖像。

通過這個插件，內容創作者可以讓生成的角色保持高度一致，能夠更高效地創作出符合其需求的視覺作品，可以用于連環畫、影片創作等場景。

實際的測評中，開源的 InstantCharacter 實現的效果媲美 GPT 4o 等模型。

從技術上看，現有基于學習的方法主要依賴于 U-Net 架構，但在泛化能力和圖像質量上存在局限性，而基于優化的方法則需要針對特定主體進行微調，這不可避免地降低了文本可控性。

為了解決這些挑戰，InstantCharacter 利用 DiT 模型構建了一個創新的框架。框架引入了一個可擴展的適配器（adapter），采用多個 transformer encoder，能夠有效處理開放域的角色特征，并與現代擴散變換器的潛在空間無縫交互。這種設計使得系統能夠靈活適應不同的角色特征。

同時，為了有效訓練框架，騰訊混元團隊還構建了一個包含千萬級樣本的大規模角色數據集。數據集被系統地組織為成對（多視角角色）和非成對（文本-圖像組合）子集。這種雙數據結構使得身份一致性和文本可編輯性能夠通過不同的學習路徑同時優化。

附項目相關鏈接：

項目官網：https://instantcharacter.github.io/

代碼：https://github.com/Tencent/InstantCharacter

Hugging Face Demo：https://huggingface.co/spaces/InstantX/InstantCharacter

論文：https://arxiv.org/abs/2504.12395

本文鏈接：http://www.www897cc.com/showinfo-45-12417-0.html一張圖 + 一句話實現任意角色場景姿勢，騰訊混元宣布開源定制化圖像生成插件 InstantCharacter

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI 新推理模型被曝產生更多“幻覺”，o3 o4-mini 性能與錯誤率一同提升

下一篇：研究稱生成式 AI 背后隱藏高昂水電消耗，直接影響數據中心周邊生活成本

標簽：

熱門焦點

虛擬人再升級，企業可以解放雙手了？

來源：伯虎財經今天想跟大家來嘮嘮AI，其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后，還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
現在的元宇宙：一款低配版的科幻游戲

在2021年的歲末之際，不禁感嘆元宇宙元年之熱鬧，從元宇宙NFT頭像，到元宇宙數字地產，再到元宇宙旅游景區等等，仿佛科幻感十足的元宇宙眨眼間就從人們的概念認知中完全
字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

正當互聯網商業躊躇不前，互聯網大廠為了在存量中的增長擠破頭皮之時，元宇宙的概念被資本點燃。先是Facebook更名Meta正式進軍元宇宙，然后字節跳動收購了一家VR硬
搭上“谷愛凌”，“柳夜熙們”站上風口？

作者：張琳曹楊從“永不塌房”的藝人到頻頻亮相北京冬奧會，作為元宇宙細分賽道之一的虛擬數字人又火了一把。2月7日，即谷愛凌摘得冬奧會自由式滑雪大跳臺金牌的
Meta正在研發元宇宙語音助手；廣東省462家企業申請元宇宙商標

今日《元宇宙新鮮事》有：扎克伯格透露正在為元宇宙研發語音助手；完美世界聲明稱不會以“元宇宙投資項目”等名義吸收資金。廣東省申請元宇宙商標的企業達462家位
元宇宙社交時代，華麗歸來的超級QQ秀重構虛擬社交場景

作者:狂人不知不覺間，QQ已經迎來了第23個生日。作為國內社交平臺的起點，QQ可謂是睥睨全網，不僅有龐大的用戶群體，還將虛擬形象及QQ整合成在線虛擬社區，開啟了時髦
在元宇宙開會是什么樣一種體驗

空間就是一切還記得面對面的會議嗎？就在不久前，與會者需要飛到遙遠的目的地，并進行鼓舞人心的對話、網絡、免費食物，甚至可能會有一兩個很好的小組討論。隨之而來
超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

在2021年《福布斯》區塊鏈50強榜單中，29家企業使用Hyperledger超級賬本技術，占比近60%。同年，研究機構Blockdata發布了的調查報告顯示，訪問Top100上市公司中，有 81

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

一張圖 + 一句話實現任意角色場景姿勢，騰訊混元宣布開源定制化圖像生成插件 InstantCharacter

虛擬人再升級，企業可以解放雙手了？

10億基金，李彥宏呼喚下一個AI獨角獸

現在的元宇宙：一款低配版的科幻游戲

字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

搭上“谷愛凌”，“柳夜熙們”站上風口？

Meta正在研發元宇宙語音助手；廣東省462家企業申請元宇宙商標

元宇宙社交時代，華麗歸來的超級QQ秀重構虛擬社交場景

在元宇宙開會是什么樣一種體驗

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

最新推薦

《從營銷AIGC化到AIGC營銷化》報告發布

中國虛擬數字人如何橫向拓展市場需求，探索發展場景?

“元宇宙第一股”Roblox緣何被資本市場看“低”？

百度虛擬人——AI手語主播首次亮相冬奧會！

虛擬人的3大紀律和6種品牌孵化模式

我們離元宇宙的實現只差一副眼鏡？

猜你喜歡

熱門推薦

相關資訊