在2025杭州云棲大會上,阿里巴巴一連發布七款人工智能大模型,其中通義萬相Wan2.5-preview憑借音畫一體視頻生成能力引發行業震動。這款被阿里稱為"最強全模態視覺生成模型"的新品,首次實現文本、圖像、音頻多模態輸入與高清視頻輸出的無縫銜接,標志著視覺生成技術邁入電影級全感官敘事時代。
技術架構層面,Wan2.5-preview采用原生多模態訓練框架,將聲音、圖像、文本作為統一語料進行模型訓練。阿里云智能CTO周靖人透露,這種創新架構使模型具備跨模態推理能力,例如可根據充滿隱喻的詩歌文本生成意境匹配的視覺畫面。在圖像生成質量上,模型支持24幀/秒的1080P高清輸出,運鏡指令遵循能力顯著提升,可實現人物變身等復雜編輯任務。
實際測試顯示,該模型在視頻生成時長、畫質、操控性三方面取得突破。單次生成視頻時長從5秒延長至10秒,支持更完整的劇情敘事。在"白人女性拆禮物"場景測試中,模型精準還原了鋼琴聲、環境音效與人物對話的時空同步,連木柴燃燒的噼啪聲都清晰可辨。更復雜的"婚禮求婚"場景里,新郎的誓言與婚禮進行曲的節奏配合毫無違和感,光影效果達到電影級水準。
多模態交互能力成為最大亮點。用戶輸入"VR玩家說唱"提示詞時,模型不僅生成充滿未來感的虛擬競技場畫面,更將Rap歌詞的每個音節與人物口型精確匹配,即便語速極快也看不出破綻。在"深海特工"測試案例中,模型通過"圖+文"輸入生成了原本不存在的虎鯊背鰭,同時合成聲吶掃描音、水流動響等12種環境音效,構建出沉浸式深海場景。
運動場景音效生成能力同樣驚艷。在"騎士騎馬"測試中,模型精準捕捉馬蹄騰空、落地的力學節奏,同時合成遠處裁判哨音與風聲的層次變化。"女子網球"場景則還原了球拍破風聲、球網撞擊聲與觀眾低語的立體聲場,這些細節使AI生成內容幾乎無法與實拍視頻區分。
音樂生成領域,模型展現出對場景氛圍的深度理解。當輸入"黑人女子街舞"提示詞時,自動生成的鼓點與貝斯旋律完美契合嘻哈風格,背景人群的掌聲節奏與舞者動作形成巧妙呼應。技術團隊透露,這種語境感知能力源于多模態預訓練架構對海量視聽數據的深度解析。
目前用戶可通過阿里云百煉平臺調用API,或在通義萬相官網直接體驗。數據顯示,該模型家族已支持文生圖、圖生視頻等10余種創作模式,累計生成3.9億張圖片和7000萬個視頻,成為中國調用量最大的視覺生成平臺之一。自今年2月開源以來,20余款模型在社區的下載量突破3000萬次,持續領跑開源視頻生成領域。
更多>同類資訊2025云棲大會天貓精靈發布未來酒店4.0,AI賦能與聯盟共繪酒店智能新藍圖09-25阿里巴巴吳泳銘云棲大會發聲:AGI非終點,ASI時代藍圖徐徐展開09-25國臺元宇宙·啟元酒:虛實交融間,以醬香之韻探尋真我新境09-24從垂類設備到智能制造領頭羊:“小巨人”領邦智能的AI視覺大模型蛻變之路09-24沙特研究新突破:AI推理能力可"提取轉移",智能升級迎新路徑09-24上海AI實驗室創新:借學術講座打造AI研究助手評測新基準09-24宇樹科技王興興:人形機器人或年底至明年上半年可實時生成多樣動作09-24阿里云AI戰略重磅發布:3800億投入迎ASI時代,十大核心要點解析09-24秘塔AI推出「Agentic Search」模式:邊搜邊做,20余種工具讓想法秒變現實09-24雷軍明日將迎健身百次打卡與年度演講,小米17系列屏幕亮點搶先看09-24?阿里吳泳銘云棲大會發聲:3800億資本開支再加碼,劍指超級人工智能時代?09-24阿里吳泳銘云棲發聲:AGI僅是開篇,通往ASI三階段路線及戰略定位揭曉09-24Qwen3-Max數學滿分領銜,Qwen3-VL等七大模型齊發,技術革新再升級09-24阿里云與英偉達強強聯手,全面集成軟件棧賦能物理AI全流程開發09-24周鴻祎:AGI短期難實現且藏風險,多智能體協同才是AI未來方向09-24點擊查看更多 +全站最新
限量50臺!梅賽德斯-邁巴赫V12 Edition官圖亮相,24K金徽標配手工定制盡顯奢華
賓利純電動SUV諜照來襲,2026年發布,定位添越之下引期待
2026款沃爾沃EX90官圖亮相:800V架構加持,雙Orin芯片助力智能駕駛升級
東風日產新款天籟四季度上市,16-18萬起售,鴻蒙座艙+2.0T引擎成亮點
?Jeep大指揮官Trail Edition官圖亮相 七座布局+2.0T柴油動力 限量150臺僅售日本市場?
蘭博基尼汽車攜手意大利海洋集團 全新Tecnomar 101FT游艇詮釋海洋奢華新境熱門內容
第22屆東博會AI元素亮眼:數字智能體引路 機器人炫技展風采
AI云競爭下半場:華為以超節點、企業Agent等破局,誰能領跑產業?
2025網安周:每日互動劉宇談AI時代,知識安全成關鍵,共筑數字新未來
中國大模型DeepSeek首登Nature封面,R1訓練成本僅約208萬引關注
華為全聯接大會2025啟幕,發布全球最強算力超節點與集群
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.www897cc.com/showinfo-45-28113-0.html阿里云棲大會重磅發布:通義萬相Wan2.5-preview引領全模態視頻生成新紀元
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com