91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python數據分析Numpy中常用相關性函數是什么

發布時間:2022-06-02 10:54:40 來源:億速云 閱讀:281 作者:zzz 欄目:開發技術

今天小編給大家分享一下Python數據分析Numpy中常用相關性函數是什么的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。

摘要:

NumPy中包含大量的函數,這些函數的設計初衷是能更方便地使用,掌握解這些函數,可以提升自己的工作效率。這些函數包括數組元素的選取和多項式運算等。

前述通過對某公司股票的收盤價的分析,了解了某些Numpy的一些函數。通常實際中,某公司的股價被另外一家公司的股價緊緊跟隨,它們可能是同領域的競爭對手,也可能是同一公司下的不同的子公司。可能因兩家公司經營的業務類型相同,面臨同樣的挑戰,需要相同的原料和資源,并且爭奪同類型的客戶。

實際中,有很多這樣的例子,如果要檢驗一下它們是否真的存在關聯。一種方法就是看看兩個公司股票收益率的相關性,強相關性意味著它們之間存在一定的關聯性(特別是當所用的數據不夠充足時,誤差可能更大)

一、股票相關性分析

1、導出兩個相關的股票數據():

Python數據分析Numpy中常用相關性函數是什么

2、分別從CSV文件中讀入相關數據

close = np.loadtxt('data036.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)
new_close = np.loadtxt('data999.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)

3、協方差描述的是兩個變量共同變化的趨勢,其實就是歸一化前的相關系數。使用 cov 函數計算股票收益率的協方差矩陣,完整代碼如下:

import numpy as np
from datetime import datetime
import matplotlib.pyplot as plt
def datestr2num(s): #定義一個函數
    return datetime.strptime(s.decode('ascii'),"%Y-%m-%d").date().weekday()
close=np.loadtxt('data036.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True) #導入data036.csv數據 
new_close=np.loadtxt('data999.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)#導入data999.csv數據
covariance = np.cov(close,new_close) #使用numpy.cov() 函數計算兩個數列的協方差矩陣
print(close.mean()) #求close的平均值
print(new_close.mean())#求new_close的平均值
print('covariance:','\n',covariance)

運行結果:

48.40690476190476
18.85157142857143
covariance: 
 [[30.46934553  1.5201865 ]
 [ 1.5201865   8.96031113]]

1)用 diagonal 函數查看矩陣對角線上的元素

print ("對角元素:", covariance.diagonal()) # diagonal查看對角上的元素

運行結果:

對角元素: [30.46934553  8.96031113]

2)使用 trace 函數計算矩陣的跡,即對角線上元素之和

print("Covariance trace", covariance.trace()) #對角線上元素之和

3)兩個向量的相關系數被定義為協方差除以各自標準差的乘積。計算向量 a 和 b 的相關系數的公式:corr(a,b)=cov(a,b)/(std(a)*std(b))

covar = covariance/ (np.std(close) * np.std(new_close))
print("相關系數矩陣:", covar)

運行結果:

相關系數矩陣: [[1.84843969 0.09222295]
 [0.09222295 0.54358223]]

注意:由于covariance是一個矩陣,因而得到的covar也是一個矩陣

相關系數是兩只股票的相關程度。相關系數的取值范圍在 -1 到 1 之間。根據定義,一組數值與自身的相關系數等于 1 ,numpy中使用 corrcoef 函數計算相關系數

closecorr = np.corrcoef(close,new_close)
print("相關系數:",'\n', closecorr )

運行結果:

相關系數: 
 [[1.         0.09200338]
 [0.09200338 1.        ]]

對角線上的元素即close和new_close與自身的相關系數,因此均為1。相關系數矩陣是關于對角線對稱的,因此另外兩個元素的值相等,表示close和new_close的相關系數等于new_close和close的相關系數。

判斷兩只股票的價格走勢是否同步的要點是,它們的差值偏離了平均差值2倍于標準差的距離,則認為這兩只股票走勢不同步。代碼如下:

difference = close - new_close
avg = np.mean(difference)
dev = np.std(difference)
print ("Out of sync:", np.abs(difference[-1]-avg)>2*dev)

運行結果:

Out of sync: False

二、多項式

微積分里有泰勒展開,也就是用一個無窮級數來表示一個可微的函數。實際上,任何可微的(從而也是連續的)函數都可以用一個N次多項式來估計,而比N次冪更高階的部分為無窮小量可忽略不計。

NumPy中的 ployfit 函數可以用多項式去擬合一系列數據點,無論這些數據點是否來自連續函數都適用。

繼續使用close和new_close的股票價格數據。用一個三次多項式去擬合兩只股票收盤價的差價。

t = np.arange(len(close)) #得到close數列的長度
poly = np.polyfit(t, close - new_close, 3) #利用長度t和兩只股票的價差,生成一個三項式,三項式有3個系數和一個常量
print("Polynomial fit", poly)

運行結果:

Polynomial fit: [ 1.61308827e-07 -4.34114354e-04  1.84480028e-01  1.33680483e+01]

用我們剛剛得到的多項式對象以及 polyval 函數,推斷下一個差值:

print ("Next value:", np.polyval(poly, t[-1] + 1))  #用生成的多項式擬合求下一個差值
print(difference[-1]) #打印最后一個實際的差值

運行結果:

Next value: 26.222936287829654
26.21

在極限情況下,差值可以在某個點為0。使用 roots 函數找出擬合的多項式函數什么時候到達0值:

print( "Roots", np.roots(poly))#root返回多項式的根

運行結果:

Roots [2138.21411788  615.9134063   -62.92728874]

三、求極值的知識

極值是函數的最大值或最小值。在高等代數微積分中,這些極值點位于函數的導數為0的位置,然后再求導數函數的根,即找出原多項式函數的極值點。

1)使用 polyder 函數對多項式函數求導

der = np.polyder(poly)
print("Derivative", der)

2)求出導數函數的根,即找出原多項式函數的極值點

print( "Extremas", np.roots(der))

運行后即得到如下:

Derivative: [ 4.83926482e-07 -8.68228709e-04  1.84480028e-01]
Extremas [1547.84609151  246.28739879]

3)用 polyval 計算多項式函數的值,并用matplotlib顯示

vals = np.polyval(poly, t)
print('vals:',vals)
print('max value:', np.argmax(vals))
print('min value:', np.argmin(vals))
plt.plot(t,difference)
plt.plot(t,vals)
plt.show()

運行結果如下:

Python數據分析Numpy中常用相關性函數是什么

以上就是“Python數據分析Numpy中常用相關性函數是什么”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

博白县| 鲜城| 安多县| 阳曲县| 漾濞| 宁远县| 龙井市| 浑源县| 柘荣县| 理塘县| 南投县| 静安区| 鹰潭市| 庆云县| 高安市| 定南县| 瑞昌市| 林州市| 池州市| 西平县| 东辽县| 密山市| 阿坝| 清远市| 三明市| 神池县| 台东市| 阳朔县| 高安市| 甘孜| 宁波市| 涿鹿县| 通城县| 海兴县| 民权县| 泽州县| 潜山县| 织金县| 尚义县| 扬州市| 柘城县|