日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

一行 Python 代碼搞定訓練分類或回歸模型

來源: 責編: 時間:2023-11-10 17:08:02 329觀看
導讀自動機器學習(Auto-ML)是指自動化數據科學模型開發流水線的組件。AutoML 減少了數據科學家的工作量,并加快了工作流程。AutoML 可用于自動化各種流水線組件,包括數據理解,EDA,數據處理,模型訓練,超參數調整等。在本文中,我們

自動機器學習(Auto-ML)是指自動化數據科學模型開發流水線的組件。AutoML 減少了數據科學家的工作量,并加快了工作流程。AutoML 可用于自動化各種流水線組件,包括數據理解,EDA,數據處理,模型訓練,超參數調整等。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

在本文中,我們將討論如何使用開放源碼的 Python 庫 LazyPredict 來自動化模型訓練過程。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

什么是 LazyPredict ?

T5E28資訊網——每日最新資訊28at.com

LazyPredict 是一個開源的 Python 庫,它自動化了模型培訓流水線并加快了工作流。LazyPredict 為一個分類數據集訓練了大約30個分類模型,為一個回歸數據集訓練了大約40個回歸模型。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

Lazypredicate 返回訓練好的模型以及它的性能指標,而不需要編寫很多代碼。我們可以比較每個模型的性能指標,并優化最佳模型以進一步提高性能。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

安裝

T5E28資訊網——每日最新資訊28at.com

可以通過以下方式從 PyPl 庫安裝 LazyPredict:T5E28資訊網——每日最新資訊28at.com

pip install lazypredict

安裝完成后,可導入庫進行分類和回歸模型的自動訓練。T5E28資訊網——每日最新資訊28at.com

from lazypredict.Supervised import LazyRegressor, LazyClassifier

用法

Lazypredicate 同時支持分類和回歸問題,因此我們將進行這兩個任務的演示:T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

波士頓住房(回歸)和泰坦尼克號(分類)數據集用于演示 LazyPredict 庫。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

() 分類任務:T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

LazyPredict 的使用非常直觀,類似于 scikit-learn。首先,為分類任務創建一個估計器 LazyClassifier 的實例。可以通過自定義指標進行評估,默認情況下,每個模型都會根據準確度、ROC AUC 分數、F1 分數進行評估。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

在進行 lazypredict 預測模型訓練之前,必須讀取數據集并對其進行處理以使其適合訓練。T5E28資訊網——每日最新資訊28at.com

import pandas as pdfrom sklearn.model_selection import train_test_split# Read the titanic datasetdf_cls = pd.read_csv("titanic.csv")df_cls = df_cls.drop(['PassengerId','Name','Ticket', 'Cabin'], axis=1)# Drop instances with null recordsdf_cls = df_cls.dropna()# feature processingdf_cls['Sex'] = df_cls['Sex'].replace({'male':1, 'female':0})df_cls['Embarked'] = df_cls['Embarked'].replace({'S':0, 'C':1, 'Q':2})# Creating train test splity = df_cls['Survived']X = df_cls.drop(columns=['Survived'], axis=1)# Call train test split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)

經過處理將數據拆分為訓練測試數據后,我們可以使用 LazyPredict 進行模型訓練。T5E28資訊網——每日最新資訊28at.com

# LazyClassifier Instance and fiting datacls= LazyClassifier(ignore_warnings=False, custom_metric=None)models, predictions = cls.fit(X_train, X_test, y_train, y_test)

T5E28資訊網——每日最新資訊28at.com

(2)回歸任務:T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

類似于分類模型訓練,lazypredicate 提供了用于回歸數據集的自動模型訓練。實現類似于分類任務,只是對實例 LazyRegressor 進行了更改。T5E28資訊網——每日最新資訊28at.com

import pandas as pdfrom sklearn.model_selection import train_test_split# read the datacolumn_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']df_reg = pd.read_csv("housing.csv", header=None, delimiter=r"/s+", names=column_names)# Creating train test splity = df_reg['MEDV']X = df_reg.drop(columns=['MEDV'], axis=1)# Call train_test_split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)
reg = LazyRegressor(ignore_warnings=False, custom_metric=None)models, predictions = reg.fit(X_train, X_test, y_train, y_test)

T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

從以上性能指標來看,AdaBoost 分類器是分類任務的最佳執行模型,而 GradientBoostingRegressor 模型是回歸任務的最佳執行模型。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

總結

T5E28資訊網——每日最新資訊28at.com

在本文中,我們討論了 LazyPredict 庫的實現,該庫可以在幾行 Python 代碼中訓練大約70個分類和回歸模型。這是一個非常方便的工具,因為它提供了模型執行情況的總體圖像,并且可以比較每個模型的性能。T5E28資訊網——每日最新資訊28at.com

T5E28資訊網——每日最新資訊28at.com

每個模型都使用其默認參數進行訓練,因為它不執行超參數調整。選擇性能最佳的模型后,開發人員可以調整模型以進一步提高性能。T5E28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-20054-0.html一行 Python 代碼搞定訓練分類或回歸模型

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: Python好用的可視化庫(從低級到高級)

下一篇: Python文件讀寫實戰:處理日常任務的終極工具!

標簽:
  • 熱門焦點
Top 主站蜘蛛池模板: 平邑县| 吉木乃县| 广东省| 台北市| 锦州市| 邻水| 政和县| 土默特左旗| 祥云县| 喀喇沁旗| 洛川县| 黎川县| 米易县| 门头沟区| 江西省| 松桃| 武义县| 胶南市| 泾川县| 铅山县| 泰兴市| 平潭县| 虞城县| 灯塔市| 旅游| 融水| 平安县| 琼海市| 常宁市| 遂昌县| 旅游| 湘乡市| 无为县| 竹北市| 开远市| 浮山县| 京山县| 新营市| 福州市| 平和县| 宁远县|