當前位置：首頁 > 科技 > 軟件

數據分析必會的十個 Python 庫

來源：責編：時間：2024-02-01 12:51:57 259觀看

導讀Scikit-learnScikit-learn 是一個功能強大的機器學習庫，為監督和無監督學習、模型選擇和預處理提供了廣泛的算法。Scikit-learn 簡化了構建機器學習模型的過程，使其成為數據科學家和分析師的熱門選擇。可以通過 pip 命

Scikit-learn

Scikit-learn 是一個功能強大的機器學習庫，為監督和無監督學習、模型選擇和預處理提供了廣泛的算法。Scikit-learn 簡化了構建機器學習模型的過程，使其成為數據科學家和分析師的熱門選擇。

可以通過 pip 命令來進行安裝。

pip install scikit-learn

以下是導入和使用 scikit-learn 的方法。

import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressiondf = pd.read_csv('data.csv')X = df.drop('target', axis=1)y = df['target']X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)model = LogisticRegression().fit(X_train, y_train)y_pred = model.predict(X_test)

Statsmodels

Statsmodels 是一個面向統計的模塊，用于數據分析、統計推斷和數據建模。它提供了模型擬合、假設檢驗等工具。Statsmodels 對于生成統計數據和假設檢驗結果特別有用。

同樣，我們也可以直接使用 pip 來安裝它。

pip install statsmodels

以下是導入和使用 Scipy 的方法。

import statsmodels.api as smimport pandas as pddf = pd.read_csv('data.csv')model = sm.OLS(endog=df['target'], exog=df[['X1', 'X2']])results = model.fit()print(results.summary())

Scipy

SciPy 是基于 Python 的一個重要科學計算庫，它構建在 NumPy 的基礎上，提供了大量的數學算法和函數工具，主要用于科學和工程領域的計算。

要安裝 Scipy，請在終端中運行以下命令。

pip install scipy

以下是導入和使用 Scipy 的方法。

import numpy as npfrom scipy.optimize import minimizedef objective(x):    return np.sum((x[0] - x[1])**2)start = np.array([1, 1])opt = minimize(objective, start, method='TNC')print(opt.x)

TensorFlow

TensorFlow 是一個開源平臺，用于構建機器學習模型以及訓練、評估和部署它們。它使用 GPU 和 TPU 提供加速計算，并支持跨多個 CPU、GPU 或 TPU 設備進行分布式訓練。

以下是導入和使用 TensorFlow 的方法。

import tensorflow as tfmodel = tf.keras.Sequential([     tf.keras.layers.Dense(64, input_shape=(1000,)),     tf.keras.layers.Dense(1),     tf.keras.layers.Activation('sigmoid') ])model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])model.fit(x_train, y_train, epochs=100, validation_split=0.2)

Keras

Keras 是一個開源神經網絡庫，用 Python 編寫，能夠在 TensorFlow 和 CNTK 上運行。它提供了更高層次的抽象，可以快速高效地構建深度學習模型。

以下是導入和使用 Keras 的方法。

import kerasfrom keras.models import Sequentialfrom keras.layers import Densemodel = Sequential()model.add(Dense(64, input_shape=(1000,)))model.add(Dense(1))model.add(Dense(1, activation='sigmoid'))model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])model.fit(x_train, y_train, epochs=100, validation_split=0.2)

PyTorch

PyTorch 是一個開源的機器學習庫，廣泛用于計算機視覺和自然語言處理等應用領域。PyTorch 以其易于使用和靈活性而聞名，特別適用于深度學習和神經網絡的研究與開發。

以下是導入和使用 PyTorch 的方法。

import torchimport torch.nn as nnimport torch.optim as optim# 創建一個簡單的線性模型model = nn.Linear(in_features=1, out_features=1)# 定義損失函數和優化器criterion = nn.MSELoss()optimizer = optim.SGD(model.parameters(), lr=0.01)# 示例數據x_train = torch.tensor([[1.0], [2.0], [3.0]])y_train = torch.tensor([[2.0], [4.0], [6.0]])# 訓練模型for epoch in range(1000):    model.train()    optimizer.zero_grad()        # 正向傳播    y_pred = model(x_train)        # 計算損失    loss = criterion(y_pred, y_train)        # 反向傳播和優化    loss.backward()    optimizer.step()# 測試模型model.eval()with torch.no_grad():    y_pred = model(torch.tensor([[4.0]]))    print(y_pred)

PySpark

PySpark 是 Apache Spark 的 Python 模塊。它提供了用于大數據處理的 Python 高級 API，并支持關系數據源和 NoSQL 數據源。PySpark 提供豐富的數據框架和 SQL 功能。

import pyspark.sql.functions as Fdf = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C'), (4, 'B')], ['id', 'word'])result = df.groupBy('word').count().orderBy('count', ascending=False)result.show()

Requests

Requests 是一種發送 HTTP 請求并處理其響應的簡單、靈活且可重用的方式。它提供了對類 UNIX 代碼定制和技術的快速訪問。

要安裝 Requests，請在終端中運行以下命令。

pip install requests

以下是導入和使用請求的方法。

import requestsresponse = requests.get('https://example.com')print(response.status_code)

BeautifulSoup

BeautifulSoup 是一個用于從 HTML 和 XML 文檔中提取數據的 Python 庫。它創建了文檔的解析樹，使得用戶可以方便地提取數據。

要安裝 BeautifulSoup，請在終端中運行以下命令。

pip install beautifulsoup4

以下是導入和使用 BeautifulSoup 的方法。

from bs4 import BeautifulSouphtml = '<ul><li>1</li><li>2</li><li>3</li></ul>'soup = BeautifulSoup(html, 'html.parser')li_list = soup.find_all('li')for li in li_list:    print(li.get_text())

Flask

Flask 是一個用 Python 編寫的輕量級 Web 應用框架。它被廣泛用于快速開發簡單的網站和 API。

from flask import Flaskapp = Flask(__name__)@app.route('/')def hello():     return 'Hello, World!'app.run()

本文鏈接：http://www.www897cc.com/showinfo-26-70471-0.html數據分析必會的十個 Python 庫

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：十個Python編程小技巧

下一篇： 2023年哪個前端框架用的最多?用數據說話

標簽：

熱門焦點

Redmi Pad評測：紅米充滿野心的一次嘗試

從Note系列到K系列，從藍牙耳機到筆記本電腦，紅米不知不覺之間也已經形成了自己頗有競爭力的產品體系，在中端和次旗艦市場上甚至要比小米新機的表現來得更好，正所謂“大丈夫生居
K8S | Service服務發現

一、背景在微服務架構中，這里以開發環境「Dev」為基礎來描述，在K8S集群中通常會開放：路由網關、注冊中心、配置中心等相關服務，可以被集群外部訪問；圖片對于測試「Tes」環境或者
如何使用JavaScript創建一只圖像放大鏡？

譯者 | 布加迪審校 | 重樓如果您曾經瀏覽過購物網站，可能遇到過圖像放大功能。它可以讓您放大圖像的特定區域，以便瀏覽。結合這個小小的重要功能可以大大改善您網站的用戶體驗
.NET 程序的 GDI 句柄泄露的再反思

一、背景1. 講故事上個月我寫過一篇如何洞察 C# 程序的 GDI 句柄泄露文章，當時用的是 GDIView + WinDbg 把問題搞定，前者用來定位泄露資源，后者用來定位泄露代碼，后面有朋友反
阿里瓴羊One推出背后，零售企業迎數字化新解

作者:劉曠近年來隨著數字經濟的高速發展，各式各樣的SaaS應用服務更是層出不窮，但本質上SaaS大多局限于單一業務流層面，對用戶核心關切的增長問題等則沒有提供更好的解法。在Saa
四年持續更迭堅持探索行業無人之境，HarmonyOS 4帶來五大升級多項創新

除了華為每年新發布的旗艦手機系列，上億花粉更加期待鴻蒙系統每次的跨版本大更新。8月4日，HarmonyOS 4于HDC 2023正式發布，這也是該系統歷經四年的再
iQOO 11S評測：行業唯一的200W標準版旗艦

【Techweb評測】去年底，iQOO推出了“電競旗艦”iQOO 11系列，作為一款性能強機，該機不僅全球首發2K 144Hz E6全感屏，搭載了第二代驍龍8平臺及144Hz電競
iQOO 11S新品發布會

iQOO將在7月4日19:00舉行新品發布會，推出杭州亞運會電競賽事官方用機iQOO 11S。
英特爾Xe HPG游戲顯卡：擁有512EU，單風扇版本

據10 月 30 日外媒 TheVerge 消息報道，英特爾 Xe HPG Arc Alchemist 的正面實被曝光，不僅擁有 512 EU 版顯卡，還擁有 128EU 的單風扇版本。另外，這款顯卡 PCB

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

數據分析必會的十個 Python 庫

Scikit-learn

Statsmodels

Scipy

TensorFlow

Keras

PyTorch

PySpark

Requests

BeautifulSoup

Flask

Redmi Pad評測：紅米充滿野心的一次嘗試

K8S | Service服務發現

如何使用JavaScript創建一只圖像放大鏡？

.NET 程序的 GDI 句柄泄露的再反思

阿里瓴羊One推出背后，零售企業迎數字化新解

四年持續更迭堅持探索行業無人之境，HarmonyOS 4帶來五大升級多項創新

iQOO 11S評測：行業唯一的200W標準版旗艦

iQOO 11S新品發布會

英特爾Xe HPG游戲顯卡：擁有512EU，單風扇版本

最新推薦

猜你喜歡

熱門推薦

相關資訊