您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關Python中相關分析correlation analysis怎么實現的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
相關分析(correlation analysis)
研究兩個或兩個以上隨機變量之間相互依存關系的方向和密切程度的方法。
線性相關關系主要采用皮爾遜(Pearson)相關系數r來度量連續變量之間線性相關強度;
r>0,線性正相關;r<0,線性負相關;
r=0,兩個變量之間不存在線性關系,并不代表兩個變量之間不存在任何關系。
相關分析函數
DataFrame.corr()
Series.corr(other)
函數說明:
如果由數據框調用corr函數,那么將會計算每個列兩兩之間的相似度
如果由序列調用corr方法,那么只是該序列與傳入的序列之間的相關度
返回值:
DataFrame調用;返回DataFrame
Series調用:返回一個數值型,大小為相關度
import numpy import pandas data = pandas.read_csv( 'C:/Users/ZL/Desktop/Python/5.4/data.csv' ) bins = [ min(data.年齡)-1, 20, 30, 40, max(data.年齡)+1 ] labels = [ '20歲以及以下', '21歲到30歲', '31歲到40歲', '41歲以上' ] data['年齡分層'] = pandas.cut( data.年齡, bins, labels=labels ) ptResult = data.pivot_table( values=['年齡'], index=['年齡分層'], columns=['性別'], aggfunc=[numpy.size] File "<ipython-input-1-ae921a24967f>", line 25 aggfunc=[numpy.size] ^ SyntaxError: unexpected EOF while parsing import numpy import pandas data = pandas.read_csv( 'C:/Users/ZL/Desktop/Python/5.4/data.csv' ) bins = [ min(data.年齡)-1, 20, 30, 40, max(data.年齡)+1 ] labels = [ '20歲以及以下', '21歲到30歲', '31歲到40歲', '41歲以上' ] data['年齡分層'] = pandas.cut( data.年齡, bins, labels=labels ) ptResult = data.pivot_table( values=['年齡'], index=['年齡分層'], columns=['性別'], aggfunc=[numpy.size] ) ptResult Out[4]: size 年齡 性別 女 男 年齡分層 20歲以及以下 111 1950 21歲到30歲 2903 43955 31歲到40歲 735 7994 41歲以上 567 886
感謝各位的閱讀!關于“Python中相關分析correlation analysis怎么實現”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。