91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

pandas數據處理之標簽列字符轉數字的實現

發布時間:2021-03-18 14:38:29 來源:億速云 閱讀:746 作者:小新 欄目:開發技術

這篇文章主要介紹pandas數據處理之標簽列字符轉數字的實現,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

機器學習中,當我們在進行數據預處理的時候,對于標簽列非字符的數據,我們往往需要將其轉換成字符,因為有的算法可能不支持非數字類型來做特征。

1.構建測試數據

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.數據轉換下,并獲取標簽列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

pandas數據處理之標簽列字符轉數字的實現

3.使用函數進行轉換

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

pandas數據處理之標簽列字符轉數字的實現

這樣,就將標簽列處理好了哈

等用完之后,再轉回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

pandas數據處理之標簽列字符轉數字的實現

補充:pandas factorize將字符串特征轉化為數字特征

將原始數據中的字符串特征轉化為模型可以識別的數字特征可是使用pandas自帶的factorzie方法。

原始數據的job特征值如下

pandas數據處理之標簽列字符轉數字的實現

都是字符串特征,無法用于訓練,當然可以單獨建立map硬編碼處理,但是pandas已經封裝好了相應的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

pandas數據處理之標簽列字符轉數字的實現

以上是“pandas數據處理之標簽列字符轉數字的實現”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

宜兰县| 攀枝花市| 桂林市| 白银市| 五常市| 武平县| 乌鲁木齐市| 芦山县| 石狮市| 体育| 文安县| 江安县| 喀喇沁旗| 临朐县| 天水市| 灵寿县| 永济市| 邮箱| 繁峙县| 吴桥县| 棋牌| 陆良县| 耒阳市| 含山县| 湘西| 威远县| 界首市| 黔西| 察隅县| 汕头市| 泰州市| 西乌| 丹凤县| 日照市| 林周县| 三门县| 沈阳市| 金堂县| 普兰县| 历史| 杭州市|