當前位置：首頁 > 科技 > 軟件

Pandas入門的12個技巧

來源：責編：時間：2024-01-03 17:22:15 249觀看

導讀今天，就為大家總結一下 “Pandas數據處理的12技巧”，拿來即用，隨查隨用。今天，就為大家總結一下 “Pandas數據處理的12技巧”，拿來即用，隨查隨用。1. 安裝你還可以使用內置的 Python 工具 pip 安裝 Pandas 并運行以下命令:$

今天，就為大家總結一下 “Pandas數據處理的12技巧”，拿來即用，隨查隨用。

1. 安裝

你還可以使用內置的 Python 工具 pip 安裝 Pandas 并運行以下命令:

$ pip install pandas

安裝完成后的提示成功，則可以環境中使用pandas包了。

import pandas

2. 創建數據列

Pandas一維數組(數據列)可以保存任何數據類型。一般通過調用 pd.Series() 方法實現，不指定index，默認為0,1,2,3...。

import pandasimport numpyS = pandas.Series(    [1, 2, 3, 4],  # 數據    index=["a", "b", "c", "d"],  # 指定索引    dtype=numpy.int8,  # 指定數據類型)S.name = "test"  # 創建一維數組的名稱S.index.name = "index"  # 創建一維數組的索引名稱print(S)

輸出:

indexa    1b    2c    3d    4Name: test, dtype: int8

3. 創建數據框

創建具有列的二維數據結構的對象(數據框)。一般通過調用 pd.DataFrame() 方法實現，不指定index，默認為0,1,2,3...。

import pandasdat_list = [    [1, 2, 3],    [4, 6, 8],    [10, 11, 12],]df = pandas.DataFrame(    dat_list,    index=["i1", "i3", "i2"],    columns=["a", "b", "c"],)print(df)

輸出:

a   b   ci1   1   2   3i3   4   6   8i2  10  11  12

4. CSV文件的讀寫

Pandas 支持從 CSV的讀寫，我們用 pd.read_csv() 和 pd.to_csv() 方法來實現。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df.to_csv("output/test.csv") # 導出到CSV文件dfnew = pandas.read_csv("output/test.csv", index_col=0) # index_col=0 表示第一列為索引print(dfnew)

5. Excel文件的讀寫

Pandas 支持從 Excel的讀寫，我們用 pd.read_excel() 和 pd.to_excel() 方法來實現。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df.to_excel("output/test.xlsx") # 導出到exceldfnew = pandas.read_excel("output/test.xlsx", index_col=0) # index_col=0 表示第一列為索引print(dfnew)

6. 通過位置選擇值

Pandas 支持通過位置選擇值，我們用 df.iloc[row_index, column_index] 來實現。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)print(df.iloc[2, 1])  # 6 結果為一個值print(df.iloc[[2], [1]])  # 結果為一個元素的數據框print(df.iloc[1:3, :])  # 結果為一個數據框

輸出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  126    Bi3  6    A  B  C   Di1  2  5  8  11i3  3  6  9  12

7. 通過名稱選擇值

Pandas 支持通過名稱選擇值，我們用 df.loc[row_name, column_name] 來實現。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)print(df.loc["i2", "C"])  # 6 結果為一個值print(df.loc[["i2"], ["C"]])  # 結果為一個元素的數據框print(df.loc[["i2", "i3"], ["A", "D"]])  # 切片

輸出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  127    Ci2  7    A   Di2  1  10i3  3  12

8. 標簽可以重復么？

這是一個有意思的問題，如果重復了如何取值呢，如何去掉重復呢？

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i2"])print(df)print(df.loc["i2", "C"])df.columns = ["A", "B", "B", "D"]print(df)print(df.loc["i2", "B"])

輸出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i2  3  6  9  12i2    7i2    9Name: C, dtype: int64    A  B  B   Di2  1  4  7  10i1  2  5  8  11i2  3  6  9  12    B  Bi2  4  7i2  6  9

9. 刪除行/列

Pandas 支持刪除行/列，我們用 df.drop([col/row name], axis=0/1) 來實現。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df.drop(    ["i2", "i1"],    axis=0,  # axis=0刪除行，axis=1刪除列    inplace=True, # 如果為True，則在原數據上進行操作，否則，創建一個新的數據對象    errors="ignore",  # 忽略不存在的列)print(df)

輸出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A  B  C   Di3  3  6  9  12

10. 在最后增加列

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12]}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df['E'] = 0print(df)

輸出為:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A  B  C   D  Ei2  1  4  7  10  0i1  2  5  8  11  0i3  3  6  9  12  0

11. 在最后增加行

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df = df.append(    pandas.DataFrame({"A": 13, "B": 14, "C": 15, "D": 16}, index=["i4"]),    ignore_index=True,)print(df)

輸出：

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A   B   C   D0   1   4   7  101   2   5   8  112   3   6   9  123  13  14  15  16

12. 通過標簽(索引或列名)排序

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12]}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df = df.sort_index(    axis=0, # axis=0 按行標簽排序，axis=1 按列標簽排序    level=None,    ascending=True, # 是否升序    inplace=False, # 是否修改原數據    kind="quicksort", # 排序算法    na_positinotallow="last", # 如果有NA值，放在最后    sort_remaining=True, # 是否排序剩余列)print(df)

輸出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A  B  C   Di1  2  5  8  11i2  1  4  7  10i3  3  6  9  12

總結

上面分享的pandas入門的12個技巧，希望對你有所幫助。

本文鏈接：http://www.www897cc.com/showinfo-26-57288-0.htmlPandas入門的12個技巧

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：加速Python循環的12種方法,最高可以提速900倍

下一篇：掌握這個技術，給輪播圖和文本插上自由之翼

標簽：

熱門焦點

一加Ace2 Pro官宣：普及16G內存引領24G

一加官方今天繼續為本月發布的新機一加Ace2 Pro帶來預熱，公布了內存方面的信息。“淘汰 8GB ，12GB 起步，16GB 普及，24GB 引領，還有呢？#一加Ace2Pro#，2023 年 8 月，敬請期待。”同時
紅魔電競平板評測：大屏幕硬實力

前言：三年的疫情因為要上網課的原因激活了平板市場，如今網課的時代已經過去，大家的生活都恢復到了正軌，這也就意味著，真正考驗平板電腦生存的環境來了。也就是面對著這種殘酷的
容量越大越不壞？24萬塊硬盤故障率報告公布這些產品零故障

8月5日消息，云存儲服務商Backblaze發布了最新的硬盤故障率報告，年故障率有所上升。Backblaze發布的硬盤季度統計數據，其中包括故障率等重要方面。這些結
28個SpringBoot項目中常用注解，日常開發、求職面試不再懵圈

前言在使用SpringBoot開發中或者在求職面試中都會使用到很多注解或者問到注解相關的知識。本文主要對一些常用的注解進行了總結，同時也會舉出具體例子，供大家學習和參考。注解
一個注解實現接口冪等，這樣才優雅！

場景碼猿慢病云管理系統中其實高并發的場景不是很多，沒有必要每個接口都去考慮并發高的場景，比如添加住院患者的這個接口，具體的業務代碼就不貼了，業務偽代碼如下：圖片上述代碼有
小米汽車電池信息疑似曝光：容量101kWh，支持800V高壓快充

7月14日消息，今日一名博主在社交媒體發布了一張疑似小米汽車電池信息的照片，顯示該電池包正是寧德時代麒麟電池，容量為101kWh，電壓為726.7V，可以預測小
iQOO 11S評測：行業唯一的200W標準版旗艦

【Techweb評測】去年底，iQOO推出了“電競旗艦”iQOO 11系列，作為一款性能強機，該機不僅全球首發2K 144Hz E6全感屏，搭載了第二代驍龍8平臺及144Hz電競
OPPO Reno10 Pro英雄聯盟定制禮盒公布：薩勒芬妮同款配色夢幻十足

5月24日，OPPO推出了全新的OPPO Reno 10系列，包含OPPO Reno10、OPPO Reno10 Pro和OPPO Reno10 Pro+三款新機，全系標配了超光影長焦鏡頭，是迄今為止拍照
英特爾Xe-HP項目終止，將專注Xe-HPC/HPG系列顯卡

據10 月 31 日消息報道，英特爾高級副總裁兼加速計算系統和圖形事業部總經理表示，Xe-HP“ Arctic Sound” 系列服務器 GPU 已經應用于 oneAPI devcloud 云服

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

Pandas入門的12個技巧

1. 安裝

2. 創建數據列

3. 創建數據框

4. CSV文件的讀寫

5. Excel文件的讀寫

6. 通過位置選擇值

7. 通過名稱選擇值

8. 標簽可以重復么？

9. 刪除行/列

10. 在最后增加列

11. 在最后增加行

12. 通過標簽(索引或列名)排序

總結

一加Ace2 Pro官宣：普及16G內存引領24G

紅魔電競平板評測：大屏幕硬實力

容量越大越不壞？24萬塊硬盤故障率報告公布這些產品零故障

28個SpringBoot項目中常用注解，日常開發、求職面試不再懵圈

一個注解實現接口冪等，這樣才優雅！

小米汽車電池信息疑似曝光：容量101kWh，支持800V高壓快充

iQOO 11S評測：行業唯一的200W標準版旗艦

OPPO Reno10 Pro英雄聯盟定制禮盒公布：薩勒芬妮同款配色夢幻十足

英特爾Xe-HP項目終止，將專注Xe-HPC/HPG系列顯卡

最新推薦

猜你喜歡

熱門推薦

相關資訊