91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python使用Pandas對csv文件進行數據處理的方法

發布時間:2020-10-25 03:32:54 來源:腳本之家 閱讀:483 作者:香香爹 欄目:開發技術

今天接到一個新的任務,要對一個140多M的csv文件進行數據處理,總共有170多萬行,嘗試了導入本地的MySQL數據庫進行查詢,結果用Navicat導入直接卡死....估計是XAMPP套裝里面全默認配置的MySQL性能不給力,又嘗試用R搞一下吧結果發現光加載csv文件就要3分鐘左右的時間,相當不給力啊,翻了翻萬能的知乎發現了Python下的一個神器包:Pandas(熊貓們?),加載這個140多M的csv文件兩秒鐘就搞定,后面的分類匯總等操作也都是秒開,太牛逼了!記錄一下這次數據處理的過程:

使用Python3.6.4環境(對中文支持比較好),安裝Pandas包

pip install pandas

基本使用:

import pandas as pd
import numpy as np #進行具體的sum,count等計算時候要用到的
df=pd.read_csv('d:/snp/nh33.csv') #這里絕對路徑一定要用/,windows下也是如此,不加參數默認csv文件首行為標題行
df.head() #查看引入的csv文件前5行數據
df[“播種面積”] #查看指定列,后面跟[:5]查看前5行數據

Python使用Pandas對csv文件進行數據處理的方法

df[“調查對象代碼”].str[:6] #獲取指定列前6位字符串

df["ADDR"]=df["調查對象代碼"].str[:6] #將上一行處理后的6位地址碼作為新列ADDR插入

Python使用Pandas對csv文件進行數據處理的方法

gp=df.groupby(["ADDR","代碼"])["播種面積"].sum() #根據ADDR和代碼進行分組后對播種面積列進行sum求和計算

Python使用Pandas對csv文件進行數據處理的方法

pv=df.pivot_table(["播種面積"],index="ADDR",columns="代碼",margins=True,aggfunc=np.sum,fill_value=0) #數據透視圖,對播種面積列進行匯總計算,index為行,columns為列,margins=True增加一個全部行匯總,aggfunc=np.sum透視圖中對播種面積值進行sum計算,這里np是開頭import的numpy as np,fill_value=0對空值進行0替換,否則沒有數據會顯示NaN

Python使用Pandas對csv文件進行數據處理的方法

pv.to_csv("d:/snp/test.csv") #寫入csv文件

總結

以上所述是小編給大家介紹的Python使用Pandas對csv文件進行數據處理的方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對億速云網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

郑州市| 屏南县| 札达县| 昆明市| 黄大仙区| 祁东县| 安龙县| 平安县| 梓潼县| 通海县| 平和县| 五寨县| 油尖旺区| 敦煌市| 清流县| 临汾市| 南宁市| 寿阳县| 丁青县| 赤峰市| 平江县| 乐至县| 朝阳县| 永定县| 漳州市| 南丰县| 万载县| 青川县| 汝城县| 商水县| 沅江市| 应城市| 抚州市| 铅山县| 商都县| 涟水县| 湖州市| 南宫市| 普洱| 文昌市| 朔州市|