您好,登錄后才能下訂單哦!
在pandas里面常用value_counts確認數據出現的頻率。
1. Series 情況下:
pandas 的 value_counts() 函數可以對Series里面的每個值進行計數并且排序。
import pandas as pd df = pd.DataFrame({'區域' : ['西安', '太原', '西安', '太原', '鄭州', '太原'], '10月份銷售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'], '9月份銷售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']}) print(df)
統計每個區域出現多少次:
print(df['區域'].value_counts())
每個區域都被計數,并且默認從高到低排序。
如果想升序排列,設置參數 ascending = True:
print(df['區域'].value_counts(ascending=True))
如果想得出計數占比,可以加參數 normalize=True
print(df['區域'].value_counts(normalize=True))
注:空值默認剔除掉的。value_counts()返回的結果是一個Series數組,可以跟別的數組進行計算。
2. DataFrame 情況下:
import pandas as pd df = pd.DataFrame({'區域1' : ['西安', '太原', '西安', '太原', '鄭州', '太原'], '區域2' : ['太原', '太原', '西安', '西安', '西安', '太原']}) print(df.apply(pd.value_counts))
區域2中沒有鄭州,所以是NaN。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。