您好,登錄后才能下訂單哦!
將原始數據中的字符串特征轉化為模型可以識別的數字特征可是使用pandas自帶的factorzie方法。
原始數據的job特征值如下
都是字符串特征,無法用于訓練,當然可以單獨建立map硬編碼處理,但是pandas已經封裝好了相應的方法。
data = pd.read_csv("data/test_set.csv") data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)
以上這篇pandas factorize實現將字符串特征轉化為數字特征就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。