您好,登錄后才能下訂單哦!
小編給大家分享一下怎么使用Python讀取幾十萬行文本數據,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
1、簡單易用,與C/C++、Java、C# 等傳統語言相比,Python對代碼格式的要求沒有那么嚴格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向對象,能夠支持面向過程編程,也支持面向對象編程;4、Python是一種解釋性語言,Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序;5、Python功能強大,擁有的模塊眾多,基本能夠實現所有的常見功能。
我在使用python讀取幾十萬行的文件中的數據,并構造字典,列表等數據結構時,再訪問字典,列表時,一般都會出現內存不夠的問題,然后只能循環讀取幾百行或者一定數量的行數來循環操作。
keyword_list=[line.strip() for line in open("keywords.txt",'r')] #f1=open("part_wiki_vec.txt",'r') f1=open("wiki_vectors.txt") f2=open("result.txt",'w') i=0 content=f1.readlines() while i<1150: for line in content[300*i:300*(i+1)]: line=line.strip().split(' ') if line[0] in keyword_list: wordvec=' '.join(line) print wordvec f2.write(wordvec) #print line i+=1
我是這樣讀取的
應該還有很多好的方法,比如多線程等等。
以上是“怎么使用Python讀取幾十萬行文本數據”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。