fillna()
是 pandas 庫中 DataFrame 和 Series 對象的一個方法,用于填充缺失值(NaN)
value
:用于替換缺失值的值。可以是一個數字、字符串或者一個方法(如平均值、眾數等)。method
:用于填充缺失值的方法。可選值包括 ‘pad’/‘ffill’(前向填充,使用前一個值填充缺失值),‘backfill’/‘bfill’(后向填充,使用后一個值填充缺失值)。axis
:指定要填充的軸。默認為 None,表示沿著 DataFrame 的每一列進行填充。如果設置為 0,則沿著每一行進行填充;如果設置為 1,則沿著每一列進行填充。inplace
:布爾值,表示是否在原 DataFrame 上進行修改。默認為 False,表示返回一個新的 DataFrame,而不修改原始 DataFrame。如果設置為 True,則會直接修改原始 DataFrame。limit
:指定連續填充的最大值。當設置為一個正整數時,表示最多填充指定數量的連續缺失值。例如,如果設置為 2,那么只有連續的兩個缺失值會被填充,超過兩個的缺失值將保持不變。downcast
:指定是否將填充后的數據類型降級。默認為 None,表示不進行降級。可以設置為 ‘infer’,表示根據填充后的數據自動推斷合適的數據類型。下面是一個使用 fillna()
方法的示例:
import pandas as pd
import numpy as np
# 創建一個包含缺失值的 DataFrame
data = {'A': [1, 2, np.nan], 'B': [np.nan, 2, 3]}
df = pd.DataFrame(data)
# 使用 fillna() 方法填充缺失值
filled_df = df.fillna(method='ffill', axis=1)
print(filled_df)
輸出結果:
A B
0 1.0 1.0
1 2.0 2.0
2 NaN 3.0