您好,登錄后才能下訂單哦!
這篇文章主要介紹python如何讀取數據,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
利用pandas中的read_csv模塊直接將數據讀取出來。
data = pd.read_csv('/home/nw/Desktop/dataset/iris.txt',header = None)
上面的代碼,read_csv中前面的是數據集存放的路徑,后面的header很重要,經常以為少了header,數據的總量減小了1,因為少掉的那一行數據變成了DataFrame里面的列索引。
還有一種是比較傳統的方法,直接用open打開文件,把文件里面的信息先取出來,不管取出來是什么樣子的,先取出來再說,想要作什么處理直接對取出的變量做處理即可。
f= open('/home/nw/Desktop/dataset/iris.txt','rb') dataset = pickle.load(f) #這種方法適用于自己存取自己的數據,有時候在讀取別人的數據的時候是不行的,因為別人存數據的方式不一定是用pickle.dump的方 ##式存數據的。 f = open('/home/nw/Desktop/dataset/iris.txt') ''' 注意這里的open后面最好不要加上其他的讀取方式,不需要‘rb’之類的讀取方式。因為在后續的數據處理中可能還需要將二進制的數 據轉換成自己想要的個數。 ''' lines = f.readlines() ''' 現在lines中已經包含了所有的數據信息,我們想要得到的數據格式都可以基于lines做處理。如我讀出的iris數據格式是一個列表的形 式,使用len(lines)得到列表中元素的個數是151,打印出lines,可以看到lines中每個元素都是一個字符串,并且每個字符串后面都 有'\n'的換行字符,最后一行是空行,所以最后一行是多余,并且要去掉每行中的'\n' ''' arr = [] for i in range(len(lines)): if lines[i] != '\n': arr.append(lines[i]) for i in range(len(arr)): arr[i] = arr[i].strip('\n')#將每行的'\n'脫去
以上是python如何讀取數據的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。