您好,登錄后才能下訂單哦!
站長用Python寫了一個可以提取csv任一列的代碼,歡迎使用。Github鏈接
csv是Comma-Separated Values的縮寫,是用文本文件形式儲存的表格數據,比如如下的表格:
就可以存儲為csv文件,文件內容是:
No.,Name,Age,Score 1,Apple,12,98 2,Ben,13,97 3,Celia,14,96 4,Dave,15,95
假設上述csv文件保存為"A.csv",如何用Python像操作Excel一樣提取其中的一列,即一個字段,利用Python自帶的csv模塊,有兩種方法可以實現:
第一種方法使用reader函數,接收一個可迭代的對象(比如csv文件),能返回一個生成器,就可以從其中解析出csv的內容:比如下面的代碼可以讀取csv的全部內容,以行為單位:
import csv with open('A.csv','rb') as csvfile: reader = csv.reader(csvfile) rows= [row for row in reader] print rows
得到:
[['No.', 'Name', 'Age', 'Score'], ['1', 'Apple', '12', '98'], ['2', 'Ben', '13', '97'], ['3', 'Celia', '14', '96'], ['4', 'Dave', '15', '95']]
要提取其中某一列,可以用下面的代碼:
import csv with open('A.csv','rb') as csvfile: reader = csv.reader(csvfile) column = [row[2] for row in reader] print column
得到:
['Age', '12', '13', '14', '15']
注意從csv讀出的都是str類型。這種方法要事先知道列的序號,比如Age在第2列,而不能根據'Age'這個標題查詢。這時可以采用第二種方法:
第二種方法是使用DictReader,和reader函數類似,接收一個可迭代的對象,能返回一個生成器,但是返回的每一個單元格都放在一個字典的值內,而這個字典的鍵則是這個單元格的標題(即列頭)。用下面的代碼可以看到DictReader的結構:
import csv with open('A.csv','rb') as csvfile: reader = csv.DictReader(csvfile) column = [row for row in reader] print column
得到:
[{'Age': '12', 'No.': '1', 'Score': '98', 'Name': 'Apple'}, {'Age': '13', 'No.': '2', 'Score': '97', 'Name': 'Ben'}, {'Age': '14', 'No.': '3', 'Score': '96', 'Name': 'Celia'}, {'Age': '15', 'No.': '4', 'Score': '95', 'Name': 'Dave'}]
如果我們想用DictReader讀取csv的某一列,就可以用列的標題查詢:
import csv with open('A.csv','rb') as csvfile: reader = csv.DictReader(csvfile) column = [row['Age'] for row in reader] print column
就得到:
['12', '13', '14', '15']
以上這篇使用python獲取csv文本的某行或某列數據的實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。