您好,登錄后才能下訂單哦!
本篇文章為大家展示了使用Pandas怎么處理缺失值,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
判斷數據是否為NaN:
pd.isnull(df), pd.notnull(df)
判斷缺失值是否存在
np.all(pd.notnull(data)) # 返回false代表有空值 np.any(pd.isnull(data)) #返回true代表有空值
處理方式:
存在缺失值nan,并且是np.nan:
value:替換成的值
inplace:True:會修改原數據,False:不替換修改原數據,生成新的對象
注:不會修改原數據,需要接受返回值
1、刪除缺失值:dropna(axis='rows')
2、替換缺失值:fillna(value, inplace=True)
# 替換存在缺失值的樣本的兩列 # 替換填充平均值,中位數 movie['Revenue (Millions)'].fillna(movie['Revenue (Millions)'].mean(), inplace=True)
不是缺失值nan,有默認標記的
to_replace- 替換前的值—被替換的
value—要修改成的值,上崗的值
再按照是nan的方式處理
將不是nan的值替換成np.nan——df.replace(to_replace,value)
# 把一些其它值標記的缺失值,替換成np.nan wis = wis.replace(to_replace='?', value=np.nan)
SSL報錯
wis = pd.read_csv(https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data)
以上數據在讀取時,可能會報如下錯誤
URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:833)>
解決辦法:
# 全局取消證書驗證 import ssl ssl._create_default_https_context = ssl._create_unverified_context
上述內容就是使用Pandas怎么處理缺失值,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。