Pandas怎么讀取大文件

發布時間：2021-11-30 14:47:23 來源：億速云閱讀：174 作者：小新欄目：大數據

這篇文章主要介紹Pandas怎么讀取大文件，文中介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們一定要看完！

如何利用pandas來讀取大文件，4個技巧：

如何利用read_csv函數讀取沒有表頭的文件
get_chunk()方法來分塊讀取數據
concat()方法將數據庫進行疊加（垂直方向）
若數據量過大，采取隨機抽放（是否放回）

Pandas怎么讀取大文件

filepath = open("taobao.csv",errors="ignore")  # 指定文件路徑
reader = pd.read_csv(filepath, 
                     header=None, 
                     names=["user_id","item_id","cat_id","type","time"],  # 指定列屬性名稱
                     iterator=True)

# loop,chunkSize,chunks = True, 10000000, []  # 連續賦值語句
loop = True
chunkSize = 10000000
chunks = []

while loop:  # loop一直為True，執行循環
    try:
        chunk = reader.get_chunk(chunkSize)
        chunks.append(chunk)
    except StopIteration:
        loop = False
        print("Iteration is stopped.")
        
# 如果考慮數據量過大，只抽取部分的數據來進行分析，采取不放回抽樣的方式
# pd.concat(chunks, ignore_index=True).sample(frac=0.05, replace=False)  不放回抽樣、記錄不重復

df = pd.concat(chunks, ignore_index=True)

以上是“Pandas怎么讀取大文件”這篇文章的所有內容，感謝各位的閱讀！希望分享的內容對大家有幫助，更多相關知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

Pandas怎么讀取大文件

如何利用pandas來讀取大文件，4個技巧：

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

Pandas怎么讀取大文件

如何利用pandas來讀取大文件，4個技巧：

猜你喜歡

最新資訊

相關推薦

相關標簽