您好,登錄后才能下訂單哦!
這篇文章主要介紹了Python如何實現平行坐標圖,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
平行坐標圖簡介
當數據的維度超過三維時,此時數據的可視化就變得不再那么簡單。為解決高維數據的可視化問題,我們可以使用平行坐標圖。以下關于平行坐標圖的解釋引自百度百科:為了克服傳統的笛卡爾直角坐標系容易耗盡空間、 難以表達三維以上數據的問題, 平行坐標圖將高維數據的各個變量用一系列相互平行的坐標軸表示, 變量值對應軸上位置。為了反映變化趨勢和各個變量間相互關系,往往將描述不同變量的各點連接成折線。所以平行坐標圖的實質是將m維歐式空間的一個點Xi(xi1,xi2,...,xim) 映射到二維平面上的一條曲線。在N條平行的線的背景下,(一般這N條線都豎直且等距),一個在高維空間的點可以被表示為一條拐點在N條平行坐標軸的折線,在第K個坐標軸上的位置就表示這個點在第K個維的值。
繪制平行坐標圖
本文主要介紹兩種利用Python繪制平行坐標圖的方法,分別是利用pandas包繪制和利用plotly包繪制(默認已安裝pandas包和plotly包)。
利用pandas實現平行坐標圖的繪制
import matplotlib.pyplot as plt import pandas as pd import seaborn as sns from pandas.plotting import parallel_coordinates data = sns.load_dataset('iris') fig,axes = plt.subplots() parallel_coordinates(data,'species',ax=axes) fig.savefig('parallel.png')
繪制的平行坐標圖如下所示:
從上圖可以看到x軸上變量共用一個y坐標軸,此時因sepal_length、sepal_width、petal_length以及petal_width這四個變量的值得范圍相近,利用這種方式作出的共用y軸的平行坐標圖有著很好的可視化效果;但假如sepal_length、sepal_width、petal_length以及petal_width這些變量的值的范圍相差較大時,這種共用y軸的平行坐標圖就不再適用,此時我們需要的是y軸獨立的平行坐標圖。下面介紹的另一種方法實現的就是y軸獨立的平行坐標圖。
plotly繪圖有兩種模式,一種是online模式,另一種是offline模式。本文使用的是offline模式,且是在jupyter notebook中進行繪圖。
首先熟悉一下plotly的繪圖方式:
import plotly as py import plotly.graph_objs as go py.offline.init_notebook_mode(connected=True) # 初始化設置 py.offline.iplot({ "data": [go.Parcoords( line = dict(color = 'blue'), dimensions = list([ dict(range = [1,5], constraintrange = [1,2], label = 'A', values = [1,4]), dict(range = [1.5,5], tickvals = [1.5,3,4.5], label = 'B', values = [3,1.5]), dict(range = [1,5], tickvals = [1,2,4,5], label = 'C', values = [2,4], ticktext = ['text 1', 'text 2', 'text 3', 'text 4']), dict(range = [1,5], label = 'D', values = [4,2]) ]) )], "layout": go.Layout(title="My first parallel coordinates") })
繪制圖形如下所示:
繪制鳶尾花數據的平行坐標圖:
df = sns.load_dataset('iris') df['species_id'] = df['species'].map({'setosa':1,'versicolor':2,'virginica':3}) #用于顏色映射 py.offline.iplot({ "data": [go.Parcoords( line = dict(color = df['species_id'], colorscale = [[0,'#D7C16B'],[0.5,'#23D8C3'],[1,'#F3F10F']]), dimensions = list([ dict(range = [2,8], constraintrange = [4,8], label = 'Sepal Length', values = df['sepal_length']), dict(range = [1,6], label = 'Sepal Width', values = df['sepal_width']), dict(range = [0,8], label = 'Petal Length', values = df['petal_length']), dict(range = [0,4], label = 'Petal Width', values = df['petal_width']) ]) )], "layout": go.Layout(title='Iris parallel coordinates plot') })
繪制的圖形如下所示:
注:關于plotly.offline.iplot、go.Parcoords以及go.Layout的用法可以利用help關鍵字查看相關幫助文檔,與pyecharts不同,plotly提供的幫助文檔非常詳細。
感謝你能夠認真閱讀完這篇文章,希望小編分享的“Python如何實現平行坐標圖”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。