91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

詳解pandas使用drop_duplicates去除DataFrame重復項參數

發布時間:2020-10-21 15:40:03 來源:腳本之家 閱讀:244 作者:OraYang 欄目:開發技術

Pandas之drop_duplicates:去除重復項

方法

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

參數

這個drop_duplicate方法是對DataFrame格式的數據,去除特定列下面的重復行。返回DataFrame格式的數據。

  • subset : column label or sequence of labels, optional 用來指定特定的列,默認所有列
  • keep : {‘first', ‘last', False}, default ‘first' 刪除重復項并保留第一次出現的項
  • inplace : boolean, default False 是直接在原來數據上修改還是保留一個副本

DataFrame中存在重復的行或者幾行中某幾列的值重復,這時候需要去掉重復行,示例如下:

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)

代碼中subset對應的值是列名,表示只考慮這兩列,將這兩列對應值相同的行進行去重。默認值為subset=None表示考慮所有列。

keep='first'表示保留第一次出現的重復行,是默認值。keep另外兩個取值為"last"和False,分別表示保留最后一次出現的重復行和去除所有重復行。

inplace=True表示直接在原來的DataFrame上刪除重復項,而默認值False表示生成一個副本。

將副本賦值給dataframe:

data=data.drop_duplicates(subset=None,keep='first',inplace=False)

這一行代碼與文章開頭提到的那行代碼效果等效,但是如果在該DataFrame上新增一列:

data['extra']=test_data['item_price_level']

就會報如下錯誤:

SettingWithCopyWarning:  A value is trying to be set on a copy of a slice from a DataFrame. 

所以如果想對DataFrame去重,最好采用開頭提到的那行代碼。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

岑巩县| 白朗县| 蒙城县| 中卫市| 镇坪县| 梁河县| 金沙县| 平和县| 绿春县| 定远县| 晴隆县| 宜君县| 盐池县| 鄂伦春自治旗| 额济纳旗| 澄迈县| 中宁县| 资讯| 渭南市| 陕西省| 靖边县| 同德县| 罗城| 囊谦县| 文山县| 长泰县| 清徐县| 莎车县| 师宗县| 顺昌县| 宣化县| 那坡县| 灵璧县| 雷州市| 搜索| 蓝山县| 昆山市| 都匀市| 凌海市| 唐河县| 大方县|