在Python中,dropna()
和notnull()
是Pandas庫中的兩個常用函數。
dropna()
函數用于刪除包含缺失值(NaN)的行或列。它的常用參數包括axis
(指定刪除行還是列,默認為行)、subset
(指定刪除時考慮的列,默認為全部列)、how
(指定刪除方式,包括any
和all
,默認為any
)、thresh
(指定每行或每列至少包含的非缺失值數量)。下面是一個使用dropna()
函數刪除包含缺失值的行的例子:
import pandas as pd
data = {'A': [1, 2, np.nan, 4],
'B': [5, np.nan, np.nan, 8],
'C': [np.nan, 10, 11, 12]}
df = pd.DataFrame(data)
df.dropna(axis=0, inplace=True) # 刪除包含缺失值的行
notnull()
函數用于判斷每個元素是否為非缺失值(即不是NaN)。它返回一個布爾值的DataFrame,其中True表示非缺失值,False表示缺失值。下面是一個使用notnull()
函數判斷DataFrame中每個元素是否為非缺失值的例子:
import pandas as pd
data = {'A': [1, 2, np.nan, 4],
'B': [5, np.nan, np.nan, 8],
'C': [np.nan, 10, 11, 12]}
df = pd.DataFrame(data)
not_null_df = df.notnull() # 判斷每個元素是否為非缺失值
希望對你有幫助!