在Pandas中處理分類變量通常有兩種方法:
astype('category')
將變量轉換為分類變量:df['category_column'] = df['category_column'].astype('category')
pd.Categorical()
將變量轉換為分類變量并指定分類順序:df['category_column'] = pd.Categorical(df['category_column'], categories=['category1', 'category2', 'category3'], ordered=True)
處理分類變量之后,可以使用分類變量的方法進行操作,例如cat.categories
獲取分類的所有類別,cat.codes
獲取類別的編碼。分類變量可以節省內存空間并提高性能。