您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關怎么在python中使用cut與qcut,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
我就廢話不多說了,直接上代碼吧:
from pandas import Series,DataFrame import pandas as pd import numpy as np from numpy import nan as NA from matplotlib import pyplot as plt ages = [20,22,25,27,21,23,37,31,61,45,41,32] #將所有的ages進行分組 bins = [18,25,35,60,100] #使用pandas中的cut對年齡數據進行分組 cats = pd.cut(ages,bins) #print(cats) #調用pd.value_counts方法統計每個區間的個數 number=pd.value_counts(cats) #print(pd.value_counts(cats)) #顯示第幾個區間index值 index=pd.cut(ages,bins).codes #print(index) #為分類出來的每一組年齡加上標簽 group_names = ["Youth","YouthAdult","MiddleAged","Senior"] personType=pd.cut(ages,bins,labels=group_names) #print(personType) plt.hist(personType) #plt.show() #cut和qcut的用法 data=[1,2,3,4,5,6,7,8,9,10] result=pd.qcut(data,4) print(' ',result)##qcut會將10個數據進行排序,然后再將data數據均分成四組 #統計落在每個區間的元素個數 print('dasdasdasdasdas: ',pd.value_counts(result)) #qcut : 跟cut一樣也可以自定義分位數(0到1之間的數值,包括端點) results=pd.qcut(data,[0,0.1,0.5,0.9,1]) print('results: ',results)
import numpy as np import pandas as pd data = np.random.rand(20) print(data) #用cut函數將一組數據分割成n份 #cut函數分割的方式:數據里的(最大值-最小值)/n=每個區間的間距 #利用數據中最大值和最小值的差除以分組數作為每一組數據的區間范圍的差值 result = pd.cut(data,4,precision=2) #precision保留小數點的有效位數 print(result) res_data=pd.value_counts(result) print(res_data)
看完上述內容,你們對怎么在python中使用cut與qcut有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。