91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Pandas怎么讀取大文件

發布時間:2021-11-30 14:47:23 來源:億速云 閱讀:174 作者:小新 欄目:大數據

這篇文章主要介紹Pandas怎么讀取大文件,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

如何利用pandas來讀取大文件,4個技巧:

  • 如何利用read_csv函數讀取沒有表頭的文件

  • get_chunk()方法來分塊讀取數據

  • concat()方法將數據庫進行疊加(垂直方向)

  • 若數據量過大,采取隨機抽放(是否放回)

Pandas怎么讀取大文件

<!--MORE-->

filepath = open("taobao.csv",errors="ignore")  # 指定文件路徑
reader = pd.read_csv(filepath, 
                     header=None, 
                     names=["user_id","item_id","cat_id","type","time"],  # 指定列屬性名稱
                     iterator=True)

# loop,chunkSize,chunks = True, 10000000, []  # 連續賦值語句
loop = True
chunkSize = 10000000
chunks = []

while loop:  # loop一直為True,執行循環
    try:
        chunk = reader.get_chunk(chunkSize)
        chunks.append(chunk)
    except StopIteration:
        loop = False
        print("Iteration is stopped.")
        
# 如果考慮數據量過大,只抽取部分的數據來進行分析,采取不放回抽樣的方式
# pd.concat(chunks, ignore_index=True).sample(frac=0.05, replace=False)  不放回抽樣、記錄不重復

df = pd.concat(chunks, ignore_index=True)

以上是“Pandas怎么讀取大文件”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

娱乐| 微山县| 临高县| 安溪县| 舒城县| 灵丘县| 鹿泉市| 甘泉县| 益阳市| 台安县| 古丈县| 馆陶县| 绥阳县| 长泰县| 汉源县| 历史| 如皋市| 惠水县| 南涧| 上虞市| 内乡县| 读书| 莆田市| 德庆县| 色达县| 蒲城县| 阿克陶县| 定兴县| 霍城县| 迁安市| 吉木乃县| 旺苍县| 邻水| 桦川县| 杨浦区| 太原市| 洛川县| 东阳市| 定日县| 汨罗市| 和硕县|