您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關怎么用Python為直方圖繪制擬合曲線,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
python的五大特點:1.簡單易學,開發程序時,專注的是解決問題,而不是搞明白語言本身。2.面向對象,與其他主要的語言如C++和Java相比, Python以一種非常強大又簡單的方式實現面向對象編程。3.可移植性,Python程序無需修改就可以在各種平臺上運行。4.解釋性,Python語言寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序。5.開源,Python是 FLOSS(自由/開放源碼軟件)之一。
直方圖是用于展示數據的分組分布狀態的一種圖形,用矩形的寬度和高度表示頻數分布,通過直方圖,用戶可以很直觀的看出數據分布的形狀、中心位置以及數據的離散程度等。
在python中一般采用matplotlib庫的hist來繪制直方圖,至于如何給直方圖添加擬合曲線(密度函數曲線),一般來說有以下兩種方法。
方法一:采用matplotlib中的mlab模塊
mlab模塊是Python中強大的3D作圖工具,立體感效果極佳。在這里使用mlab可以跳出直方圖二維平面圖形的限制,在此基礎上再添加一條曲線。在這里,我們以鳶尾花iris中的數據為例,來舉例說明。
import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt import pandas # Load dataset url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data" names = ['sepal-length', 'sepal-width','petal-length', 'petal-width', 'class'] dataset = pandas.read_csv(url, names=names) print(dataset.head(10)) # descriptions print(dataset.describe()) x = dataset.iloc[:,0] #提取第一列的sepal-length變量 mu =np.mean(x) #計算均值 sigma =np.std(x) mu,sigma
以上為通過python導入鳶尾花iris數據,然后提取第一列的sepal-length變量為研究對象,計算出其均值、標準差,接下來就繪制帶擬合曲線的直方圖。
num_bins = 30 #直方圖柱子的數量 n, bins, patches = plt.hist(x, num_bins,normed=1, facecolor='blue', alpha=0.5) #直方圖函數,x為x軸的值,normed=1表示為概率密度,即和為一,綠色方塊,色深參數0.5.返回n個概率,直方塊左邊線的x值,及各個方塊對象 y = mlab.normpdf(bins, mu, sigma)#擬合一條最佳正態分布曲線y plt.plot(bins, y, 'r--') #繪制y的曲線 plt.xlabel('sepal-length') #繪制x軸 plt.ylabel('Probability') #繪制y軸 plt.title(r'Histogram : $\mu=5.8433$,$\sigma=0.8253$')#中文標題 u'xxx' plt.subplots_adjust(left=0.15)#左邊距 plt.show()
以上命令主要采用mlab.normpdf基于直方圖的柱子數量、均值、方差來擬合曲線,然后再用plot畫出來,這種方法的一個缺點就是畫出的正態分布擬合曲線(紅色虛線)并不一定能很好反映數據的分布情況,如上圖所示。
方法二:采用seaborn庫中的distplot繪制
Seaborn其實是在matplotlib的基礎上進行了更高級的API封裝,從而使得作圖更加容易,在大多數情況下使用seaborn就能做出很具有吸引力的圖,而使用matplotlib就能制作具有更多特色的圖。應該把Seaborn視為matplotlib的補充,而不是替代物。
import seaborn as sns sns.set_palette("hls") #設置所有圖的顏色,使用hls色彩空間 sns.distplot(x,color="r",bins=30,kde=True) plt.show()
在這里主要使用sns.distplot(增強版dist),柱子數量bins也設置為30,kde=True表示是否顯示擬合曲線,如果為False則只出現直方圖。
在這里注意一下它與前邊mlab.normpdf方法不同的是,擬合曲線不是正態的,而是更好地擬合了數據的分布情況,如上圖,因此比mlab.normpdf更為準確。
進一步設置sns.distplot,可以采用kde_kws(擬合曲線的設置)、hist_kws(直方柱子的設置),可以得到:
import seaborn as sns import matplotlib as mpl sns.set_palette("hls") mpl.rc("figure", figsize=(6,4)) sns.distplot(x,bins=30,kde_kws={"color":"seagreen", "lw":3 }, hist_kws={ "color": "b" }) plt.show()
其中,lw為曲線粗細程度。
關于“怎么用Python為直方圖繪制擬合曲線”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。