您好,登錄后才能下訂單哦!
小編給大家分享一下pandas中read_csv缺失值怎么辦,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
今天遇到的問題是,要將一份csv數據讀入dataframe,但某些列中含有NA值。對于這些列來說,NA應該作為一個有意義的level,而不是缺失值,但read_csv函數會自動將類似的缺失值理解為缺失值并變為NaN。
看pandas文檔中read_csv函數中這兩個參數的描述,默認會將'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''轉換為NaN,且na_values參數還支持定義另外的應處理為缺失值的值。
值得注意的是keep_default_na參數,這個參數的作用是決定要不要保留默認應該轉換的缺失值列表,將這個參數設為False之后同時不定義na_values參數,就可以在讀取文件時不將任何值轉換為缺失值NaN。
例:
import pandas as pd df = pd.read_csv('train.csv', keep_default_na=False)
以上是“pandas中read_csv缺失值怎么辦”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。