您好,登錄后才能下訂單哦!
今天小編給大家分享一下Python怎么解決新客人數、回購人數和總人數問題的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。
讀取流水
saleflow= pd.read_csv('流水.csv',index_col=0)
篩選出合生元益生菌的流水
#處理字段 yyp_saleflow=saleflow[saleflow['cls']=='營養品'] yyp_saleflow=saleflow[saleflow['custype']=='vip'] ysj_saleflow = yyp_saleflow[yyp_saleflow['cls2']=='益生菌'] ysj_saleflow['pinpai'] =ysj_saleflow.apply(pinpai_class_new,axis=1) # print('益生菌流水數', ysj_saleflow.shape[0]) ysj_saleflow= ysj_saleflow[ysj_saleflow['pinpai']=='合生元'] # print('合生元益生菌流水數', ysj_saleflow.shape[0])
求每個會員第一次購買合生元益生菌的時間,從而篩選出某個季度的新客
# 會員第一次購買益生菌的時間
ysj_first =ysj_saleflow.groupby(['shopid_cardid']).oper_date.min().reset_index().rename(columns={'oper_date':'oper_date_first'})
ysj_first['oper_date_first']=pd.to_datetime(ysj_first['oper_date_first'])
# 各個季度的新客
ysj_new_Q1= ysj_first[(ysj_first['oper_date_first'] < pd.to_datetime('2020-04-01 00:00:00'))&(ysj_first['oper_date_first'] > pd.to_datetime('2020-01-01 00:00:00'))]
ysj_new_Q3= ysj_first[(ysj_first['oper_date_first'] < pd.to_datetime('2019-10-01 00:00:00'))&(ysj_first['oper_date_first'] > pd.to_datetime('2019-07-01 00:00:00'))]
ysj_new_Q4 = ysj_first[(ysj_first['oper_date_first'] < pd.to_datetime('2020-01-01 00:00:00'))&(ysj_first['oper_date_first'] > pd.to_datetime('2019-10-01 00:00:00'))]
比如 Q3的新客有
這樣我們就有了各個季度的新客ID
再計算老客, 老客定義為第三季度和第二季度都買過合生元的會員,所有只用用第三季度的流水會員id和 第二季度的會員id 進行 inner join
ysj_saleflow2019=ysj_saleflow.query('year==2019')ysj_saleflow2019Q2_id=ysj_saleflow2019[ysj_saleflow2019.month.isin([4,5,6])][['shopid_cardid']]ysj_saleflow2019Q3_id=ysj_saleflow2019[ysj_saleflow2019.month.isin([7,8,9])][['shopid_cardid']]ysj_saleflow2019Q4_id=ysj_saleflow2019[ysj_saleflow2019.month.isin([10,11,12])][['shopid_cardid']]ysj_Q3_old_id= (ysj_saleflow2019Q2_id.merge(ysj_saleflow2019Q3_id)).drop_duplicates()
再計算 Q3 的新客有多少在Q4又購買了合生元益生菌, 即回購
思路是 拿Q4的會員id 與 Q3新客id inner join
#Q3 新客 在 年底回購人數
Q3new_to_Q4 =(ysj_saleflow2019Q4_id.merge(ysj_new_Q3)).shopid_cardid.nunique()
最后計算人數,并創建dataframe
# 新客人數Q3_new=ysj_new_Q3.shopid_cardid.nunique()# Q3 益生菌總人數Q3_YSJ_total= ysj_saleflow2019Q3_id.shopid_cardid.nunique()# 老客人數ysj_Q3_old_id= (ysj_saleflow2019Q2_id.merge(ysj_saleflow2019Q3_id)).drop_duplicates()Q3_old=ysj_Q3_old_id.shopid_cardid.nunique()#.reset_index() # Q3 老客人數#Q3 新客 在 年底回購人數Q3new_to_Q4 =(ysj_saleflow2019Q4_id.merge(ysj_new_Q3)).shopid_cardid.nunique()## 創建dataframedata = {'Q3益生菌總會員人數': [Q3_YSJ_total], 'Q3新客人數': [Q3_new], 'Q3老客人數': [Q3_old], 'Q3新客在年底回購的人數':[Q3new_to_Q4] , 'shopId':[shopId] }frame = pd.DataFrame(data, columns = ['Q3益生菌總人數', 'Q3新客人數', 'Q3老客人數', 'Q3新客在年底回購的人數','shopId'])
這里只計算了一個連鎖,如果 計算多個連鎖, 可以對 連鎖列表進行循環
依次 df.append(). 具體做法是 在循環之前建立一個空的dataframe
df_empty =pd.DataFrame(columns=('Q3益生菌總會員人數','Q3新客人數','Q3老客人數','Q3新客在年底回購的人數','shopId'))
每循環一次 就讓df_empty 新增一個連鎖的數據,即
df_empty=df_empty.append(frame,ignore_index=True)
偽代碼:
df_empty =pd.DataFrame(columns=('Q3益生菌總會員人數','Q3新客人數','Q3老客人數','Q3新客在年底回購的人數','shopId'))
for 某一個連鎖 in 連鎖列表:
計算某個連鎖,得到frame
df_empty= df_empty.append(frame, ignore_index=True)
以上就是“Python怎么解決新客人數、回購人數和總人數問題”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。