您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python從不同格式文件中加載數據的速度舉例分析”,在日常操作中,相信很多人在Python從不同格式文件中加載數據的速度舉例分析問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Python從不同格式文件中加載數據的速度舉例分析”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
熟悉Python數據分析和跟各種數據存儲文件打交道的人可能都知道,就算是相同的數據內容,但用Python從不同格式的載體中讀取數據的速度是不一樣的。為了驗證這一結論,我特意測試了一下,分別用Python從Excel,MySQL和CSV中讀取數據的效率。
工具:
jupyter notebook(Python),
Navicat(MySQL),
Microsoft Excel 2016
CSV(Excel按F12另存為)
接著進入正題,以下就是我的測試結果:
聲明:使用的都是同一份數據源(除去表頭,總共有159727條數據)!
① 直接用Python從Excel加載數據(29M),第1次花了48秒,第2次花46.1秒;另外,計算結果只需花費幾十到幾百毫秒;
處理數據的時間,花了幾十到幾百毫秒不等:
② 把Excel的數據(29M)導入到Navicat(可以寫MySQL語句的一款編輯器)中,花了28.9秒;
處理數據的時間,花了0.134s
③ 用Python直接從MySQL中獲取剛才從Excel中導入的數據,第1次花了1.91秒,第2次花了2.01秒,第3次花了1.99秒,第4次花了1.79秒;
處理數據的時間,花了59ms.
④ 用Python讀取把剛才29M的Excel,另存為一個32.1M大小的CSV文件(數據內容相同),才試了一次,居然只花了1.3秒(瞬開!驚奇!)
處理數據的時間,花了19ms
到此,關于“Python從不同格式文件中加載數據的速度舉例分析”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。