當(dāng)前位置：首頁(yè) > 科技 > 軟件

數(shù)據(jù)處理利器：Pandas帶你游刃有余操控結(jié)構(gòu)化數(shù)據(jù)

來(lái)源：責(zé)編：時(shí)間：2023-12-05 09:24:01 283觀看

導(dǎo)讀當(dāng)談到數(shù)據(jù)處理和分析時(shí)，Pandas 是一個(gè)非常受歡迎的 Python 庫(kù)。它提供了高效且靈活的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)操作工具，特別適用于處理和分析結(jié)構(gòu)化數(shù)據(jù)。在本次講解中，我將為您詳細(xì)介紹 Pandas 的各個(gè)方面，包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)讀

當(dāng)談到數(shù)據(jù)處理和分析時(shí)，Pandas 是一個(gè)非常受歡迎的 Python 庫(kù)。它提供了高效且靈活的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)操作工具，特別適用于處理和分析結(jié)構(gòu)化數(shù)據(jù)。在本次講解中，我將為您詳細(xì)介紹 Pandas 的各個(gè)方面，包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)讀取與寫入、數(shù)據(jù)選擇與過(guò)濾、數(shù)據(jù)操作與轉(zhuǎn)換以及數(shù)據(jù)聚合與分組等。

數(shù)據(jù)結(jié)構(gòu)

Pandas 主要提供了兩種重要的數(shù)據(jù)結(jié)構(gòu)：Series 和 DataFrame。

Series 是一維標(biāo)記數(shù)組，類似于帶有標(biāo)簽的 NumPy 數(shù)組。每個(gè) Series 包含一個(gè)數(shù)據(jù)數(shù)組和一個(gè)與之相關(guān)的索引數(shù)組。創(chuàng)建 Series 的方式包括直接傳入數(shù)組、字典或標(biāo)量等。

DataFrame 是一個(gè)二維表格數(shù)據(jù)結(jié)構(gòu)，可以看作是由多個(gè) Series 組成的字典。它具有行索引和列索引，可以用于處理結(jié)構(gòu)化的表格數(shù)據(jù)。DataFrame 可以通過(guò)傳入字典、NumPy 數(shù)組、CSV 文件等方式進(jìn)行創(chuàng)建。

數(shù)據(jù)讀取與寫入

Pandas 提供了多種方法來(lái)讀取和寫入不同格式的數(shù)據(jù)，如 CSV、Excel、SQL 數(shù)據(jù)庫(kù)等。常用的讀取方法包括 read_csv()、read_excel()、read_sql() 等，而寫入方法包括 to_csv()、to_excel()、to_sql() 等。

讀取數(shù)據(jù)的示例：

import pandas as pd# 從 CSV 文件讀取數(shù)據(jù)data = pd.read_csv('data.csv')# 從 Excel 文件讀取數(shù)據(jù)data = pd.read_excel('data.xlsx')# 從 SQL 數(shù)據(jù)庫(kù)讀取數(shù)據(jù)import sqlite3conn = sqlite3.connect('database.db')data = pd.read_sql('SELECT * FROM table', conn)

數(shù)據(jù)選擇與過(guò)濾

Pandas 提供了多種方式來(lái)選擇和過(guò)濾數(shù)據(jù)，以滿足不同的需求。

選擇列：使用 DataFrame 的列名稱或索引來(lái)選擇單列或多列數(shù)據(jù)。

# 選擇單列column = df['column_name']# 選擇多列columns = df[['column_name1', 'column_name2']]

選擇行：使用切片、布爾索引或條件表達(dá)式來(lái)選擇滿足特定條件的行。

# 使用切片選擇行rows = df[start:end]# 使用布爾索引選擇行rows = df[boolean_expression]# 使用條件表達(dá)式選擇行rows = df[df['column_name'] > 10]

選擇單元格：使用 .loc[row_index, column_index] 或 .iloc[row_index, column_index] 來(lái)選擇單個(gè)單元格的值。

# 使用標(biāo)簽索引選擇單元格value = df.loc[row_label, column_label]# 使用整數(shù)索引選擇單元格value = df.iloc[row_index, column_index]

數(shù)據(jù)操作與轉(zhuǎn)換

Pandas 提供了各種數(shù)據(jù)操作和轉(zhuǎn)換方法，可以對(duì)數(shù)據(jù)進(jìn)行處理、清洗和轉(zhuǎn)換。

數(shù)據(jù)排序：使用 sort_values() 方法按照指定的列對(duì)數(shù)據(jù)進(jìn)行排序。

# 按照單列排序sorted_data = df.sort_values('column_name')# 按照多列排序sorted_data = df.sort_values(['column_name1', 'column_name2'])

缺失值處理：使用 isnull()、notnull() 和 dropna() 方法來(lái)處理缺失值。

# 檢查缺失值null_values = df.isnull()# 刪除包含缺失值的行clean_data = df.dropna()# 填充缺失值filled_data = df.fillna(value)

數(shù)據(jù)轉(zhuǎn)換：使用 apply()、map() 和 replace() 方法對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換和替換。

# 對(duì)列應(yīng)用函數(shù)df['new_column'] = df['column'].apply(function)# 使用字典映射替換值df['column'] = df['column'].map(mapping_dict)# 替換指定值df['column'] = df['column'].replace(old_value, new_value)

數(shù)據(jù)聚合與分組

Pandas 具備強(qiáng)大的數(shù)據(jù)聚合和分組功能，可以對(duì)數(shù)據(jù)進(jìn)行匯總和分析。

聚合函數(shù)：Pandas 提供了許多常用的聚合函數(shù)，如 sum()、mean()、count()、max()、min() 等，可以對(duì)數(shù)據(jù)進(jìn)行求和、平均值、計(jì)數(shù)、最大值和最小值等操作。

# 對(duì)列進(jìn)行求和sum_value = df['column'].sum()# 對(duì)列進(jìn)行平均值計(jì)算mean_value = df['column'].mean()# 對(duì)列進(jìn)行計(jì)數(shù)count_value = df['column'].count()# 對(duì)列進(jìn)行最大值和最小值計(jì)算max_value = df['column'].max()min_value = df['column'].min()

分組操作：使用 groupby() 方法對(duì)數(shù)據(jù)進(jìn)行分組操作，并應(yīng)用相應(yīng)的聚合函數(shù)。

# 按照列進(jìn)行分組并求和grouped_data = df.groupby('column').sum()# 按照多列進(jìn)行分組并求平均值grouped_data = df.groupby(['column1', 'column2']).mean()# 對(duì)多列應(yīng)用多個(gè)聚合函數(shù)grouped_data = df.groupby('column').agg({'column1': 'sum', 'column2': 'mean'})

以上是對(duì) Pandas 的一個(gè)詳細(xì)講解，涵蓋了數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)讀取與寫入、數(shù)據(jù)選擇與過(guò)濾、數(shù)據(jù)操作與轉(zhuǎn)換以及數(shù)據(jù)聚合與分組等方面。Pandas 是一個(gè)非常強(qiáng)大和靈活的數(shù)據(jù)處理工具，在數(shù)據(jù)分析和數(shù)據(jù)科學(xué)領(lǐng)域廣泛應(yīng)用。

本文鏈接：http://www.www897cc.com/showinfo-26-38108-0.html數(shù)據(jù)處理利器：Pandas帶你游刃有余操控結(jié)構(gòu)化數(shù)據(jù)

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：鮮為人知的 jackson Pointer 語(yǔ)法，超好用！

下一篇：被人說(shuō) Lambda 代碼像...，那是沒(méi)用下面這三個(gè)方法

標(biāo)簽：

熱門焦點(diǎn)

Find N3入網(wǎng)：最高支持16+1TB

OPPO將于近期登場(chǎng)的Find N3折疊屏目前已經(jīng)正式入網(wǎng)，型號(hào)為PHN110。本次Find N3在外觀方面相比前兩代有很大的變化，不再是小號(hào)的橫向折疊屏，而是跟別的廠商一樣采用了較為常見(jiàn)的
5月安卓手機(jī)好評(píng)榜：魅族20 Pro奪冠

性能榜和性價(jià)比榜之后，我們來(lái)看最后的安卓手機(jī)好評(píng)榜，數(shù)據(jù)來(lái)源安兔兔評(píng)測(cè)，收集時(shí)間2023年5月1日至5月31日，僅限國(guó)內(nèi)市場(chǎng)。第一名：魅族20 Pro好評(píng)率：97.50%不得不感慨魅族老品牌還
5月iOS設(shè)備好評(píng)榜：iPhone 14僅排第43？

來(lái)到新的一月，安兔兔的各個(gè)榜單又重新匯總了數(shù)據(jù)，像安卓陣營(yíng)的榜單都有著比較大的變動(dòng)，不過(guò)iOS由于設(shè)備的更新?lián)Q代并沒(méi)有那么快，所以相對(duì)來(lái)說(shuō)變化并不大，特別是iOS好評(píng)榜，老款設(shè)
服務(wù)存儲(chǔ)設(shè)計(jì)模式：Cache-Aside模式

Cache-Aside模式一種常用的緩存方式，通常是把數(shù)據(jù)從主存儲(chǔ)加載到KV緩存中，加速后續(xù)的訪問(wèn)。在存在重復(fù)度的場(chǎng)景，Cache-Aside可以提升服務(wù)性能，降低底層存儲(chǔ)的壓力，缺點(diǎn)是緩存和底
重估百度丨大模型，能撐起百度的“今天”嗎?

自象限原創(chuàng) 作者｜程心羅輯2023年之前，對(duì)于自己的“今天”，百度也很迷茫。“新業(yè)務(wù)到 2022 年底還是 0，希望 2023 年出來(lái)一個(gè) 1。”這是2022年底，李彥宏
三星獲批量產(chǎn)iPhone 15全系屏幕：蘋果史上最驚艷直屏

按照慣例，蘋果將繼續(xù)在今年9月舉辦一年一度的秋季新品發(fā)布會(huì)，有傳言稱發(fā)布會(huì)將于9月12日舉行，屆時(shí)全新的iPhone 15系列將正式與大家見(jiàn)面，不出意外的話
到手價(jià)3099元起！iQOO Neo8 Pro今日首銷：安卓性能最強(qiáng)旗艦

5月23日，iQOO如期舉行了新品發(fā)布會(huì)，全新的iQOO Neo8系列也正式與大家見(jiàn)面，包含iQOO Neo8和iQOO Neo8 Pro兩個(gè)版本，其中標(biāo)準(zhǔn)版搭載高通驍龍8+，而Pro版更
引領(lǐng)旗艦級(jí)影像能力向中端機(jī)普及 OPPO K11 系列發(fā)布 1799 元起

7月25日，OPPO正式發(fā)布K系列新品—— OPPO K11 。此次 K11 在中端手機(jī)市場(chǎng)長(zhǎng)期被忽視的影像板塊發(fā)力，突破性地搭載索尼 IMX890 旗艦大底主攝，支持 OIS
機(jī)構(gòu)稱Q2全球智能手機(jī)出貨量同比下滑11% 蘋果份額依舊第2

7月20日消息，據(jù)外媒報(bào)道，研究機(jī)構(gòu)的報(bào)告顯示，由于需求下滑，今年二季度全球智能手機(jī)的出貨量，同比下滑了11%，三星、蘋果等主要廠商的銷量，較去年同期均有下

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

數(shù)據(jù)處理利器：Pandas帶你游刃有余操控結(jié)構(gòu)化數(shù)據(jù)

數(shù)據(jù)結(jié)構(gòu)

數(shù)據(jù)讀取與寫入

數(shù)據(jù)選擇與過(guò)濾

數(shù)據(jù)操作與轉(zhuǎn)換

數(shù)據(jù)聚合與分組

Find N3入網(wǎng)：最高支持16+1TB

5月安卓手機(jī)好評(píng)榜：魅族20 Pro奪冠

5月iOS設(shè)備好評(píng)榜：iPhone 14僅排第43？

服務(wù)存儲(chǔ)設(shè)計(jì)模式：Cache-Aside模式

重估百度丨大模型，能撐起百度的“今天”嗎?

三星獲批量產(chǎn)iPhone 15全系屏幕：蘋果史上最驚艷直屏

到手價(jià)3099元起！iQOO Neo8 Pro今日首銷：安卓性能最強(qiáng)旗艦

引領(lǐng)旗艦級(jí)影像能力向中端機(jī)普及 OPPO K11 系列發(fā)布 1799 元起

機(jī)構(gòu)稱Q2全球智能手機(jī)出貨量同比下滑11% 蘋果份額依舊第2

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊