5 月 15 日消息,科技媒體 TechCrunch 昨日(5 月 14 日)發(fā)布博文,報(bào)道稱 AI 初創(chuàng)公司 Stability AI 推出 Stable Audio Open Small,號稱是市場上速度最快的“立體聲”音頻生成 AI 模型,可在智能手機(jī)上運(yùn)行。
相比較 Suno 和 Udio 等其他 AI 音頻應(yīng)用,Stable Audio Open Small 無需依賴云端處理,其高效設(shè)計(jì)讓它能在智能手機(jī)上流暢運(yùn)行。Stability AI 表示,該模型能在不到 8 秒的時(shí)間內(nèi),在手機(jī)上生成最長 11 秒的音頻片段,適用于快速制作鼓點(diǎn)或樂器片段等音效。
在訓(xùn)練方面,Stability AI 攜手芯片制造商 Arm,針對 Arm CPU 特別優(yōu)化,可以在智能手機(jī)上離線運(yùn)行;在訓(xùn)練數(shù)據(jù)集方面,不同于 Suno 和 Udio 等競爭對手(據(jù)稱使用了含版權(quán)內(nèi)容的數(shù)據(jù),存在知識產(chǎn)權(quán)風(fēng)險(xiǎn)),全部來自 Free Music Archive 和 Freesound 免版稅音頻庫。
注:現(xiàn)階段 Stable Audio Open Small 僅支持英文提示,無法生成逼真的歌聲或高質(zhì)量歌曲,且由于訓(xùn)練數(shù)據(jù)偏向西方風(fēng)格,不同音樂類型的表現(xiàn)參差不齊。
此外使用條款較為嚴(yán)格:研究人員、愛好者及年收入低于 100 萬美元的企業(yè)可免費(fèi)使用,但超過這一收入門檻的開發(fā)者或組織需購買 Stability AI 的企業(yè)許可證。
本文鏈接:http://www.www897cc.com/showinfo-45-12948-0.html速度最快:Stable Audio Open Small 端側(cè)音頻模型登場,手機(jī)上 8 秒內(nèi) AI 生成 11 秒音頻
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com