pandas數據處理之標簽列字符轉數字的實現

發布時間：2021-03-18 14:38:29 來源：億速云閱讀：746 作者：小新欄目：開發技術

這篇文章主要介紹pandas數據處理之標簽列字符轉數字的實現，文中介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們一定要看完！

機器學習中，當我們在進行數據預處理的時候，對于標簽列非字符的數據，我們往往需要將其轉換成字符，因為有的算法可能不支持非數字類型來做特征。

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

pandas數據處理之標簽列字符轉數字的實現

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

pandas數據處理之標簽列字符轉數字的實現

這樣，就將標簽列處理好了哈

等用完之后，再轉回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

pandas數據處理之標簽列字符轉數字的實現

補充：pandas factorize將字符串特征轉化為數字特征

將原始數據中的字符串特征轉化為模型可以識別的數字特征可是使用pandas自帶的factorzie方法。

原始數據的job特征值如下

pandas數據處理之標簽列字符轉數字的實現

都是字符串特征,無法用于訓練，當然可以單獨建立map硬編碼處理，但是pandas已經封裝好了相應的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

pandas數據處理之標簽列字符轉數字的實現

以上是“pandas數據處理之標簽列字符轉數字的實現”這篇文章的所有內容，感謝各位的閱讀！希望分享的內容對大家有幫助，更多相關知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本