當前位置：首頁 > 科技 > 軟件

基于Python和Surprise庫，新手也能動手搭建推薦系統

來源：責編：時間：2023-12-08 09:14:58 257觀看

導讀1、簡介在數據時代，推薦系統是提升用戶體驗的重要工具。今天介紹如何使用亞馬遜的電影評分數據集創建電影推薦系統。2、數據加載與探索首先，通過加載和探索數據集開啟數據分析過程。首先導入Pandas和Numpy，這是進行數據

1、簡介

在數據時代，推薦系統是提升用戶體驗的重要工具。今天介紹如何使用亞馬遜的電影評分數據集創建電影推薦系統。

2、數據加載與探索

首先，通過加載和探索數據集開啟數據分析過程。首先導入Pandas和Numpy，這是進行數據處理的基礎庫。通過檢查數據集的前幾行、形狀、大小和統計摘要進行探索。.head()方法可以讓我們一窺數據集的全貌，而.shape方法則展示了數據集的大小。

import pandas as pdimport numpy as np amazon = pd. read_csv (" path_to / Amazon . csv")print ( amazon . head ()print (" Dataset ? shape :", amazon . shape )

3、數據清洗和預處理

為了確保分析的完整性，必須替換缺失值并完善DataFrame。fillna方法可用于處理缺失值，這對于保持數據完整性至關重要。刪除不相關的列（如'user_id'）可以使分析集中在電影評分上。

Amazon_filtered = amazon . fillna ( value =0)Amazon_filtered1 = Amazon_filtered . drop ( columns =’user_id ’)

4、深入分析瀏覽量和評分

通過分析瀏覽量，分析電影的受歡迎程度，這涉及對評分進行求和并找到最大值。按電影對評分進行求和可以得到一個受歡迎度指標。argmax()函數可以識別出觀看次數最多的電影。

Amazon_max_views = Amazon_filtered1 .sum ()max_views_index = Amazon_max_views . argmax ()print (" Most_viewed _movie _index :", max_views_index )

5、計算平均評分

通過計算電影的平均評分，可以了解觀眾的總體滿意度。

average_ratings = Amazon_max_views . mean ()print (" Average_rating :", average_ratings )

6、建立推薦模型：SVD算法

格式化數據供Surprise使用：通過準備數據以供Surprise庫使用來為推薦做好準備。

from surprise import Reader , Datasetreader = Reader ( rating_scale =(-1, 10))data = Dataset . load_from_df ( melt_df . fillna (0) , reader )

模型訓練與評估：該系統的開發目的是根據用戶的偏好來推薦電影，推薦系統的首選工具Surprise庫。

from surprise import SVDfrom surprise.model_selection import train_test_split ,cross_validatetrainset , testset = train_test_split (data , test_size =0.25)algo = SVD ()algo . fit( trainset )predictions = algo . test ( testset )cross_validate (algo , data , measures =[ ’RMSE ’, ’MAE ’], cv =3,verbose = True )

進行預測：現在，使用SVD算法進行預測，該算法是進行矩陣因式分解的強大工具，用于預測用戶對電影的評分。

user_id = ’ A1CV1WROP5KTTW ’movie = ’Movie6 ’rating = 5algo . predict ( user_id , movie , r_ui = rating )

結果如下所示：

圖片

7、結論（模型應用）

這個腳本不僅揭示了亞馬遜電影評分數據的復雜性，還提供了一個多功能的分析工具包。這里的方法也可以適用于各種數據場景。例如，在教育領域，類似的推薦系統可以推薦個性化的學習材料、課程甚至課外活動，從而提高學生的參與度和學習效果。

8、教育示例

利用Surprise庫，根據學生的偏好推薦教育資源。

數據集：

import pandas as pd# 假設'education_data.csv'包含列'student_id'、'resource_id'和'rating'education_data = pd. read_csv (" path_to / education_data . csv")print ( education_data . head ()

分析資源受歡迎程度：

找出最受歡迎或評分最高的教育資源。

resource_popularity = education_filtered . groupby’resource_id ’). sum ()most_popular_resource =resource_popularity [’rating ’]. idxmax ()print (" Most_popular_resource :{ most_popular_resource }")

建立教育推薦模型：

利用Surprise庫，根據用戶偏好推薦教育資源。

resource_popularity =education_filtered . groupby (’ resource_id ’). sum ()most_popular_resource =resource_popularity [’rating ’]. idxmax ()print (" Most _popular _resource :{ most_popular_resource }")

推薦教育資源：

針對特定學生和教育資源預測評分，展示該模型在教育環境中的適用性。

Student_id = ’student123 ’resource = ’course456 ’predicted_rating = algo . predict ( Student_id , resource ). estprint (" Predicted_rating_for_resource{ resource }_by_user_{ user_id }:{ predicted_rating }")

可以在Github上查看源代碼和數據集。

【Github】：https://github.com/chukolate007/amazon-user-based-recommendation-system

本文鏈接：http://www.www897cc.com/showinfo-26-39517-0.html基于Python和Surprise庫，新手也能動手搭建推薦系統

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：用 print 太慢了！強烈推薦這款 Python Debug 工具

下一篇：使用RabbitMQ和Spring Cloud Stream實現異步通信

標簽：

熱門焦點

鴻蒙OS 4.0公測機型公布：甚至連nova6都支持

華為全新的HarmonyOS 4.0操作系統將于今天下午正式登場，官方在發布會之前也已經正式給出了可升級的機型產品，這意味著這些機型會率先支持升級享用。這次的HarmonyOS 4.0支持
盧偉冰長文解析K60至尊版對Redmi有著里程碑式的意義

在今天的Redmi后性能時代戰略發布會結束之后，Redmi總經理盧偉冰又帶來了一篇長文，詳解了為什么 Redmi 要開啟后性能時代？為什么選擇和 MediaTek、Pixelworks 深度合作？以及后性
俄羅斯：將審查iPhone等外國公司設備保數據安全

iPhone和特斯拉都屬于在各自領域領頭羊的品牌，推出的產品也也都是數一數二的，但對于一些國家而言，它們的產品可靠性和安全性還是在限制范圍內。近日，俄羅斯聯邦通信、信息技術
天貓精靈Sound Pro體驗：智能音箱沒有音質？來聽聽我的

這幾年除了手機作為智能生活終端最主要的核心之外，第二個可以成為中心點的產品是什么？——是智能音箱。手機在執行命令的時候有兩種操作方式，手和智能語音助手，而智能音箱只
6月iOS設備好評榜：第一蟬聯榜首近一年

作為安兔兔各種榜單里變化最小的那個，2023年6月的iOS好評榜和上個月相比沒有任何排名上的變化，僅僅是部分設備好評率的下降，長年累月的用戶評價和逐漸退出市場的老款機器讓這
摸魚心法第一章——和配置文件說拜拜

為了能摸魚我們團隊做了容器化，但是帶來的問題是服務配置文件很麻煩，然后大家在群里進行了“親切友好”的溝通圖片圖片圖片圖片對比就對比，簡單對比下獨立配置中心和k8s作為配
Flowable工作流引擎的科普與實踐

一.引言當我們在日常工作和業務中需要進行各種審批流程時，可能會面臨一系列技術和業務上的挑戰。手動處理這些審批流程可能會導致開發成本的增加以及業務復雜度的上升。在這
共享單車的故事講到哪了？

來源丨海克財經與共享充電寶相差不多，共享單車已很久沒有被國內熱點新聞關照到了。除了一再漲價和用戶直呼用不起了。近日多家媒體再發報道稱，成都、天津、鄭州等地多個共享單
2022爆款：ROG魔霸6 冰川散熱系統持續護航

喜逢開學季，各大商家開始推出自己的新產品，進行打折促銷活動。對于忠實的端游愛好者來說，能夠擁有一款夢寐以求的筆記本電腦是一件十分開心的事。但是現在的

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

基于Python和Surprise庫，新手也能動手搭建推薦系統

1、簡介

2、數據加載與探索

3、數據清洗和預處理

4、深入分析瀏覽量和評分

5、計算平均評分

6、建立推薦模型：SVD算法

7、結論（模型應用）

8、教育示例

鴻蒙OS 4.0公測機型公布：甚至連nova6都支持

盧偉冰長文解析K60至尊版對Redmi有著里程碑式的意義

俄羅斯：將審查iPhone等外國公司設備保數據安全

天貓精靈Sound Pro體驗：智能音箱沒有音質？來聽聽我的

6月iOS設備好評榜：第一蟬聯榜首近一年

摸魚心法第一章——和配置文件說拜拜

Flowable工作流引擎的科普與實踐

共享單車的故事講到哪了？

2022爆款：ROG魔霸6 冰川散熱系統持續護航

最新推薦

猜你喜歡

熱門推薦

相關資訊