當(dāng)前位置：首頁(yè) > 元宇宙 > AI

B站開(kāi)源動(dòng)漫視頻生成模型 AniSora V3 版，速度更快、質(zhì)量更高

來(lái)源：責(zé)編：時(shí)間：2025-07-09 12:05:31 44觀看

導(dǎo)讀 7 月 7 日消息，B站團(tuán)隊(duì)的開(kāi)源動(dòng)漫視頻生成模型 AniSora 于 7 月 2 日更新到 AniSora V3 預(yù)覽版。作為 Index-AniSora 項(xiàng)目的一部分，V3 版本在原有基礎(chǔ)上進(jìn)一步優(yōu)化了生成質(zhì)量、動(dòng)作流暢度和風(fēng)格多樣性，為動(dòng)漫、

7 月 7 日消息，B站團(tuán)隊(duì)的開(kāi)源動(dòng)漫視頻生成模型 AniSora 于 7 月 2 日更新到 AniSora V3 預(yù)覽版。

作為 Index-AniSora 項(xiàng)目的一部分，V3 版本在原有基礎(chǔ)上進(jìn)一步優(yōu)化了生成質(zhì)量、動(dòng)作流暢度和風(fēng)格多樣性，為動(dòng)漫、漫畫(huà)及 VTuber 內(nèi)容創(chuàng)作者提供了更強(qiáng)大的工具。

AniSora 支持一鍵生成多種動(dòng)漫風(fēng)格的視頻鏡頭，包括番劇片段、國(guó)創(chuàng)動(dòng)畫(huà)、漫畫(huà)改編、VTuber 內(nèi)容、動(dòng)畫(huà) PV、鬼畜（MAD）等。

AniSora V3 基于B站此前開(kāi)源的 CogVideoX-5B 和 Wan2.1-14B 模型，結(jié)合強(qiáng)化學(xué)習(xí)與人類(lèi)反饋（RLHF）框架，顯著提升了生成視頻的視覺(jué)質(zhì)量和動(dòng)作一致性。其支持一鍵生成多種風(fēng)格的動(dòng)漫視頻鏡頭，包括番劇片段、國(guó)創(chuàng)動(dòng)畫(huà)、漫畫(huà)視頻改編、VTuber 內(nèi)容等。

核心升級(jí)包括：

時(shí)空掩碼模塊（Spatiotemporal Mask Module）優(yōu)化：V3 版本增強(qiáng)了時(shí)空控制能力，支持更復(fù)雜的動(dòng)畫(huà)任務(wù)，如精細(xì)的角色表情控制、動(dòng)態(tài)鏡頭移動(dòng)和局部圖像引導(dǎo)生成。例如，提示“五位女孩在鏡頭放大時(shí)起舞，左手上舉至頭頂再下放至膝蓋”能生成流暢的舞蹈動(dòng)畫(huà)，鏡頭與角色動(dòng)作同步自然。

數(shù)據(jù)集擴(kuò)展：V3 繼續(xù)依托超過(guò) 1000 萬(wàn)高質(zhì)量動(dòng)漫視頻片段（從 100 萬(wàn)原始視頻中提取）進(jìn)行訓(xùn)練，新增數(shù)據(jù)清洗流水線，確保生成內(nèi)容的風(fēng)格一致性和細(xì)節(jié)豐富度。

硬件優(yōu)化：V3 新增對(duì)華為 Ascend910B NPU 的原生支持，完全基于國(guó)產(chǎn)芯片訓(xùn)練，推理速度提升約 20%，生成 4 秒高清視頻僅需 2-3 分鐘。

多任務(wù)學(xué)習(xí)：V3 強(qiáng)化了多任務(wù)處理能力，支持從單幀圖像生成視頻、關(guān)鍵幀插值到唇部同步等功能，特別適合漫畫(huà)改編和 VTuber 內(nèi)容創(chuàng)作。

在最新基準(zhǔn)測(cè)試中，AniSora V3 在VBench和雙盲主觀測(cè)試中，角色一致性和動(dòng)作流暢度均達(dá)到業(yè)界頂尖水平（SOTA），尤其在復(fù)雜動(dòng)作 (如違反物理規(guī)律的夸張動(dòng)漫動(dòng)作) 上表現(xiàn)突出。

V3 還引入了首個(gè)針對(duì)動(dòng)漫視頻生成的RLHF 框架，通過(guò) AnimeReward 和 GAPO 等工具對(duì)模型進(jìn)行微調(diào)，確保輸出更符合人類(lèi)審美和動(dòng)漫風(fēng)格需求。社區(qū)開(kāi)發(fā)者已開(kāi)始基于 V3 開(kāi)發(fā)定制化插件，例如增強(qiáng)特定動(dòng)漫風(fēng)格（如吉卜力風(fēng)）的生成效果。

AniSora V3 支持多種動(dòng)漫風(fēng)格，包括日本動(dòng)漫、國(guó)產(chǎn)原創(chuàng)動(dòng)畫(huà)、漫畫(huà)改編、VTuber 內(nèi)容及惡搞動(dòng)畫(huà)（鬼畜動(dòng)畫(huà)），覆蓋 90% 的動(dòng)漫視頻應(yīng)用場(chǎng)景。具體應(yīng)用包括：

單圖轉(zhuǎn)視頻：用戶上傳一張高質(zhì)量動(dòng)漫圖像，配合文本提示（如“角色在向前行駛的車(chē)中揮手，頭發(fā)隨風(fēng)擺動(dòng)”），即可生成動(dòng)態(tài)視頻，保持角色細(xì)節(jié)和風(fēng)格一致。

漫畫(huà)改編：從漫畫(huà)幀生成帶唇部同步和動(dòng)作的動(dòng)畫(huà)，適合快速制作預(yù)告片或短篇?jiǎng)赢?huà)。

VTuber 與游戲：支持實(shí)時(shí)生成角色動(dòng)畫(huà)，助力獨(dú)立創(chuàng)作者和游戲開(kāi)發(fā)者快速測(cè)試角色動(dòng)作。

高分辨率輸出：生成視頻支持高達(dá) 1080p，確保在社交媒體、流媒體平臺(tái)上的專(zhuān)業(yè)呈現(xiàn)。

AIbase 測(cè)試顯示，V3 在生成復(fù)雜場(chǎng)景（如多角色交互、動(dòng)態(tài)背景）時(shí)，相比 V2 減少了約 15% 的偽影問(wèn)題，生成時(shí)間縮短至平均 2.5 分鐘（注：4 秒視頻）。

相比 OpenAI 的 Sora 或 Kling 等通用視頻生成模型，AniSora V3 專(zhuān)注于動(dòng)漫領(lǐng)域。與字節(jié)跳動(dòng)的 EX-4D 相比，AniSora V3 更專(zhuān)注于 2D / 2.5D 動(dòng)漫風(fēng)格，而非 4D 多視角生成。

附開(kāi)源地址：

https://github.com/bilibili/Index-anisora/tree/main

本文鏈接：http://www.www897cc.com/showinfo-45-14452-0.htmlB站開(kāi)源動(dòng)漫視頻生成模型 AniSora V3 版，速度更快、質(zhì)量更高

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：清華大學(xué)唯一持股具身智能企業(yè)“星動(dòng)紀(jì)元”完成近 5 億元 A 輪融資

下一篇：字節(jié)跳動(dòng)開(kāi)源其 AI IDE 工具核心組件 Trae-Agent

標(biāo)簽：

熱門(mén)焦點(diǎn)

冰墩墩NFT遇冷，價(jià)格跌80%，日成交僅3筆。

“兩日上漲千倍”并不存在，且冰墩墩NFT的市場(chǎng)熱度遠(yuǎn)不及社交媒體所稱(chēng)的那樣高。2月11日，獲得國(guó)際奧委會(huì)授權(quán)的2022冬奧會(huì)吉祥物冰墩墩相關(guān)NFT產(chǎn)品在nWayPlay上線
智能人機(jī)交互技術(shù)的春晚大考

1月初的一個(gè)早晨，京東智能客戶服務(wù)產(chǎn)品部緊急開(kāi)會(huì)，進(jìn)行關(guān)于尚未對(duì)外公布的“X項(xiàng)目”的初討論。1月5日，這個(gè)神秘的X項(xiàng)目對(duì)外公布，京東成為央視2022年春晚獨(dú)家互動(dòng)合
2022年中國(guó)元宇宙產(chǎn)業(yè)系列研究報(bào)告-基礎(chǔ)設(shè)施篇（5）

傳感器是由敏感元件和轉(zhuǎn)換元件構(gòu)成，能夠感受規(guī)定的檢測(cè)量(物理量、化學(xué)量、生物量等)，并按照一定規(guī)律將檢測(cè)量轉(zhuǎn)化成可用的輸出信號(hào)的器件和裝置，進(jìn)而滿足信息的
NFT盜竊案：為什么NFT市場(chǎng)被盜竊和黑客所困擾？

Block-806NFT的增長(zhǎng)值得關(guān)注。許多人愿意為數(shù)字藝術(shù)支付數(shù)百萬(wàn)美元，世界正在走向數(shù)字化。報(bào)告顯示，NFT市場(chǎng)和NFT收藏從2020年的1.06億美元增加到了2021年的442億
NFT 技術(shù)將傳世之作帶入博物館

意大利四大博物館已與一個(gè)項(xiàng)目合作，該項(xiàng)目將展示和銷(xiāo)售達(dá)芬奇、卡拉瓦喬、拉斐爾和莫迪利亞尼等人的杰作的 NFT復(fù)制品。該計(jì)劃采用了科技公司Cincello的國(guó)際專(zhuān)
韓國(guó)流行音樂(lè)巨頭SM與Binance達(dá)成NFT合作伙伴關(guān)系

韓國(guó)流行音樂(lè)巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達(dá)成“Play2Create”NFT 合作伙伴關(guān)系。SM 娛樂(lè)一直在投資打造元宇宙該公司于 2020 年 10
Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基礎(chǔ)設(shè)施，以支持其蓬勃發(fā)展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語(yǔ)之一，這在很大程度上是由 Facebo
元宇宙收割了誰(shuí)

作者：曉宇資本將元宇宙看作下一代互聯(lián)網(wǎng)的門(mén)票，畫(huà)大餅、割韭菜就成了一大選項(xiàng)。2021年被稱(chēng)為元宇宙元年。在這一年里，先是號(hào)稱(chēng)元宇宙第一股的沙盒游戲Roblox盛裝
超級(jí)賬本Julian Gordon：聯(lián)盟鏈與公鏈的競(jìng)爭(zhēng)不是非此即彼

在2021年《福布斯》區(qū)塊鏈50強(qiáng)榜單中，29家企業(yè)使用Hyperledger超級(jí)賬本技術(shù)，占比近60%。同年，研究機(jī)構(gòu)Blockdata發(fā)布了的調(diào)查報(bào)告顯示，訪問(wèn)Top100上市公司中，有 81

猜你喜歡

SQL Error: select * from ***_ecms_news13 where id in(127,201,,23,56,160) limit 6

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

首頁(yè)

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

B站開(kāi)源動(dòng)漫視頻生成模型 AniSora V3 版，速度更快、質(zhì)量更高

冰墩墩NFT遇冷，價(jià)格跌80%，日成交僅3筆。

智能人機(jī)交互技術(shù)的春晚大考

2022年中國(guó)元宇宙產(chǎn)業(yè)系列研究報(bào)告-基礎(chǔ)設(shè)施篇（5）

NFT盜竊案：為什么NFT市場(chǎng)被盜竊和黑客所困擾？

NFT 技術(shù)將傳世之作帶入博物館

韓國(guó)流行音樂(lè)巨頭SM與Binance達(dá)成NFT合作伙伴關(guān)系

Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

元宇宙收割了誰(shuí)

超級(jí)賬本Julian Gordon：聯(lián)盟鏈與公鏈的競(jìng)爭(zhēng)不是非此即彼

最新推薦

雷克薩斯高管，“受賄”5000萬(wàn)？

如何對(duì)一款 NFT 項(xiàng)目進(jìn)行價(jià)值評(píng)估？

Meta元宇宙女性安全問(wèn)題頻發(fā)，元宇宙中相關(guān)問(wèn)題該如何解決？

“虛擬人”角斗場(chǎng)，基于“硬實(shí)力”下的人性平衡法則？

新聞業(yè)在元宇宙的現(xiàn)狀和未來(lái)

虛擬人的3大紀(jì)律和6種品牌孵化模式

猜你喜歡

熱門(mén)推薦

相關(guān)資訊