在Python的pandas庫中,fillna()
函數用于填充缺失值(NaN)
使用常數值填充: 可以使用一個指定的常數值來填充缺失值。例如,將所有缺失值替換為0:
df.fillna(0, inplace=True)
使用前一個值填充(前向填充): 可以使用缺失值之前的那個值來填充缺失值。這種方法也稱為前向填充(forward fill)。例如:
df.fillna(method='ffill', inplace=True)
使用后一個值填充(后向填充): 可以使用缺失值之后的那個值來填充缺失值。這種方法也稱為后向填充(backward fill)。例如:
df.fillna(method='bfill', inplace=True)
使用平均值填充: 可以使用缺失值所在列的平均值來填充缺失值。例如:
df.fillna(df.mean(), inplace=True)
使用中位數填充: 可以使用缺失值所在列的中位數來填充缺失值。例如:
df.fillna(df.median(), inplace=True)
使用眾數填充: 可以使用缺失值所在列的眾數來填充缺失值。例如:
df.fillna(df.mode().iloc[0], inplace=True)
使用插值填充: 可以使用插值方法來填充缺失值。例如,使用線性插值:
df.interpolate(method='linear', inplace=True)
在使用fillna()
函數時,可以根據實際需求選擇合適的填充策略。注意,填充缺失值是數據預處理的一部分,應該根據數據的特點和分析目標來選擇合適的方法。