5 月 30 日消息,俄羅斯搜索引擎巨頭 Yandex 昨日發布了世界上最大的音樂推薦系統開源數據集 Yambda,包含 47.9 億條匿名用戶的交互數據,旨在幫助開發者創建智能音樂服務。
Yandex 在十個月內收集了近 2800 萬 Yandex Music 月度用戶的數據,具體為用戶與 939 萬首歌曲的 47.9 億次交互,數據集包括聽眾對歌曲好惡的關鍵反饋,所有交互都帶有時間戳以提高準確度。
Yambda 在 Hugging Face 提供三種大小的數據集供自由下載:Yambda-5B(來自 100 萬名用戶的行為)、Yambda-500M(10 萬用戶)和 Yambda-50M(1 萬用戶)。其中規模最大的5B 數據集至少需要 85 GB 存儲空間。
數據集包含音樂聽眾的偏好信息,以 Apache Parquet 格式存儲,可用作研究用途或開發類似 Spotify 等流媒體服務提供的 AI 音樂推薦功能。
據了解,Spotify 和 Tidal 等流媒體服務通常不會發布其音樂推薦算法的代碼或模型,因為推薦聽眾喜愛歌曲的能力被視為其成功的商業秘密。
本文鏈接:http://www.www897cc.com/showinfo-45-13294-0.htmlYandex 發布最大音樂推薦開源數據集 Yambda
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com