91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

pandas去除重復列的實現方法

發布時間:2020-10-25 20:05:37 來源:腳本之家 閱讀:486 作者:Emily_2018 欄目:開發技術

數據準備

假設我們目前有兩個數據表:

① 一個數據表是關于三個人他們的id以及其他的幾列屬性信息

import pandas as pd
import numpy as np
data = pd.DataFrame(np.random.randint(low=1,high=20,size=(3,4)))
data['id'] = range(1,4)
# 輸出:其中,最左邊的0 1 2 為其索引

pandas去除重復列的實現方法

② 另外一個數據表是3個用戶的app操作日志信息,一個人會有多條app操作記錄

sample = pd.DataFrame(np.random.randint(low=1,high=9,size=(7,1)),columns=['hhh'])
sample['id'] = [1,1,2,2,3,3,3]
# 輸出:

pandas去除重復列的實現方法

問題描述

① 首先我們需要統計每個用戶app操作記錄數,比如上表可以看出用戶id為1的用戶有2條操作記錄,用戶id為3的用戶有3條操作記錄

s = sample.groupby('id').count()
# 輸出:

pandas去除重復列的實現方法

② 此時,S是一個以id為索引,count出來的記錄數為value的Series結構。因為考慮到后面我們需要id列進行merge,所以我們需要讓id列從索引列變成真實的一列。

s = s.reset_index()
# 輸出:

pandas去除重復列的實現方法

③ 將S與最上的data表進行merge,我們不想要看到重復的id列,甚至我們也可以將問題延伸為S與data表不止是id列的重復,還有好多條其他的列的重復,那么如何保證將它們merge之后沒有重復列呢?

解決方案

第一想法是用 DataFrame.drop(‘列名') 或者用 del DataFrame[‘列名']

但是如果用該方法,會刪除掉所有的重復列,而達不到我們的要求。

辦法是: 參考StackOverflow解答

cols_to_use = s.columns.difference(data.columns) # pandas版本在0.15及之上的都可以用這種方法,該方法找出S和data表的不同列,然后再進行merge
pd.merge(data, s[cols_to_use], left_index=True, right_index=True, how='outer')

pandas去除重復列的實現方法

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

依安县| 岑巩县| 楚雄市| 古交市| 秦皇岛市| 青铜峡市| 高要市| 平度市| 西盟| 梅州市| 靖州| 永康市| 桃源县| 景泰县| 繁昌县| 灵台县| 定西市| 贵德县| 商洛市| 荃湾区| 铜川市| 定结县| 榆中县| 乌拉特前旗| 临清市| 开鲁县| 酒泉市| 肥城市| 长岛县| 社会| 柞水县| 淮滨县| 肃宁县| 彭阳县| 福州市| 凌海市| 枝江市| 克拉玛依市| 南丰县| 蓬溪县| 禄劝|