在Python的pandas庫中,fillna()
函數用于填充缺失值。這個函數有多種方法可以填充缺失值,包括使用常數、前一個值、后一個值或插值方法等。
以下是一些使用fillna()
函數的例子:
import pandas as pd
# 創建一個包含缺失值的DataFrame
data = {'A': [1, 2, None, 4], 'B': [None, 2, 3, 4]}
df = pd.DataFrame(data)
# 使用常數值填充缺失值,例如0
df_filled = df.fillna(0)
df_filled = df.fillna(method='ffill')
df_filled = df.fillna(method='bfill')
df_filled = df.interpolate()
df_filled = df.fillna(method='ffill', limit=1)
這里的limit=1
表示只使用前一個值填充,如果前一個值也是缺失值,則不進行填充。
需要注意的是,fillna()
函數默認會返回一個新的DataFrame,原始的DataFrame不會被修改。如果需要直接修改原始的DataFrame,可以使用inplace=True
參數:
df.fillna(0, inplace=True)
這樣,原始的DataFrame就會被修改,所有的缺失值都會被填充為0。