您好,登錄后才能下訂單哦!
本篇內容介紹了“怎么用python pandas庫讀取excel/csv中指定行或列數據”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
關鍵!!!!使用loc函數來查找。
話不多說,直接演示:
有以下名為try.xlsx表:
條件:首先導入的數據必須的有index
或者自己添加吧,方法簡單,讀取excel文件時直接加index_col
代碼示例:
import pandas as pd #導入pandas庫 excel_file = './try.xlsx' #導入excel數據 data = pd.read_excel(excel_file, index_col='姓名') #這個的index_col就是index,可以選擇任意字段作為索引index,讀入數據 print(data.loc['李四'])
打印結果就是
部門 B
工資 6600
Name: 李四, dtype: object
(注意點:索引)
假如我們的表中,有某個員工的工資數據為空了,那我們怎么找到自己想要的數據呢。
代碼如下:
for i in data.columns: for j in range(len(data)): if (data[i].isnull())[j]: bumen = data.iloc[j, [0]] #找出缺失值所在的部門 data[i][j] = charuzhi(bumen)
原理很簡單,首先檢索全部的數據,然后我們可以用pandas中的iloc函數。上面的iloc[j, [2]]中j是具體的位置,【0】是你要得到的數據所在的column
例如查找A部門所有成員的的姓名和工資或者工資低于3000的人:
代碼如下:
"""根據條件查詢某行數據""" import pandas as pd #導入pandas庫 excel_file = './try.xlsx' #導入文件 data = pd.read_excel(excel_file) #讀入數據 print(data.loc[data['部門'] == 'A', ['姓名', '工資']]) #部門為A,打印姓名和工資 print(data.loc[data['工資'] < 3000, ['姓名','工資']]) #查找工資小于3000的人
結果如下:
若要把這些數據獨立生成excel文件或者csv文件:
添加以下代碼
"""導出為excel或csv文件""" #單條件 dataframe_1 = data.loc[data['部門'] == 'A', ['姓名', '工資']] #單條件 dataframe_2 = data.loc[data['工資'] < 3000, ['姓名', '工資']] #多條件 dataframe_3 = data.loc[(data['部門'] == 'A')&(data['工資'] < 3000), ['姓名', '工資']] #導出為excel dataframe_1.to_excel('dataframe_1.xlsx') dataframe_2.to_excel('dataframe_2.xlsx')
data['columns'] #columns即你需要的字段名稱即可 #注意這列的columns不能是index的名稱 #如果要打印index的話就data.index data.columns #與上面的一樣
以上全過程用到的庫:
pandas,xlrd , openpyxl
主要使用的就是函數iloc
data.iloc[:,:2] #即全部行,前兩列的數據
逗號前是行,逗號后是列的范圍,很容易理解
data.iloc[:10,:][data.工資>6000]
這樣即可找出前11行里工資大于6000的所有人的信息了
“怎么用python pandas庫讀取excel/csv中指定行或列數據”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。