5 月 15 日消息,科技媒體 TechCrunch 昨日(5 月 14 日)發(fā)布博文,報道稱 AI 初創(chuàng)公司 Stability AI 推出 Stable Audio Open Small,號稱是市場上速度最快的“立體聲”音頻生成 AI 模型,可在智能手機上運行。
相比較 Suno 和 Udio 等其他 AI 音頻應用,Stable Audio Open Small 無需依賴云端處理,其高效設計讓它能在智能手機上流暢運行。Stability AI 表示,該模型能在不到 8 秒的時間內(nèi),在手機上生成最長 11 秒的音頻片段,適用于快速制作鼓點或樂器片段等音效。
在訓練方面,Stability AI 攜手芯片制造商 Arm,針對 Arm CPU 特別優(yōu)化,可以在智能手機上離線運行;在訓練數(shù)據(jù)集方面,不同于 Suno 和 Udio 等競爭對手(據(jù)稱使用了含版權內(nèi)容的數(shù)據(jù),存在知識產(chǎn)權風險),全部來自 Free Music Archive 和 Freesound 免版稅音頻庫。
注:現(xiàn)階段 Stable Audio Open Small 僅支持英文提示,無法生成逼真的歌聲或高質(zhì)量歌曲,且由于訓練數(shù)據(jù)偏向西方風格,不同音樂類型的表現(xiàn)參差不齊。
此外使用條款較為嚴格:研究人員、愛好者及年收入低于 100 萬美元的企業(yè)可免費使用,但超過這一收入門檻的開發(fā)者或組織需購買 Stability AI 的企業(yè)許可證。
本文鏈接:http://www.www897cc.com/showinfo-45-12948-0.html速度最快:Stable Audio Open Small 端側(cè)音頻模型登場,手機上 8 秒內(nèi) AI 生成 11 秒音頻
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com