您好,登錄后才能下訂單哦!
Python中怎么實現時間序列可視化,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。
1.單個時間序列
首先,我們從tushare.pro獲取指數日線行情數據,并查看數據類型。
import tushare as ts import pandas as pd pd.set_option('expand_frame_repr', False) # 顯示所有列 ts.set_token('your token') pro = ts.pro_api() df = pro.index_daily(ts_code='399300.SZ')[['trade_date', 'close']] df.sort_values('trade_date', inplace=True) df.reset_index(inplace=True, drop=True) print(df.head()) trade_date close 0 20050104 982.794 1 20050105 992.564 2 20050106 983.174 3 20050107 983.958 4 20050110 993.879 print(df.dtypes) trade_date object close float64 dtype: object
交易時間列'trade_date' 不是時間類型,而且也不是索引,需要先進行轉化。
df['trade_date'] = pd.to_datetime(df['trade_date']) df.set_index('trade_date', inplace=True) print(df.head()) close trade_date 2005-01-04 982.794 2005-01-05 992.564 2005-01-06 983.174 2005-01-07 983.958 2005-01-10 993.879
接下來,就可以開始畫圖了,我們需要導入matplotlib.pyplot【2】,然后通過設置set_xlabel()和set_xlabel()為x軸和y軸添加標簽。
import matplotlib.pyplot as plt ax = df.plot(color='') ax.set_xlabel('trade_date') ax.set_ylabel('399300.SZ close') plt.show()
matplotlib庫中有很多內置圖表樣式可以選擇,通過打印plt.style.available查看具體都有哪些選項,應用的時候直接調用plt.style.use('fivethirtyeight')即可。
print(plt.style.available) ['bmh', 'classic', 'dark_background', 'fast', 'fivethirtyeight', 'ggplot', 'grayscale', 'seaborn-bright', 'seaborn-colorblind', 'seaborn-dark-palette', 'seaborn-dark', 'seaborn-darkgrid', 'seaborn-deep', 'seaborn-muted', 'seaborn-notebook', 'seaborn-paper', 'seaborn-pastel', 'seaborn-poster', 'seaborn-talk', 'seaborn-ticks', 'seaborn-white', 'seaborn-whitegrid', 'seaborn', 'Solarize_Light2', 'tableau-colorblind10', '_classic_test'] plt.style.use('fivethirtyeight') ax1 = df.plot() ax1.set_title('FiveThirtyEight Style') plt.show()
2.設置更多細節
上面畫出的是一個很簡單的折線圖,其實可以在plot()里面通過設置不同參數的值,為圖添加更多細節,使其更美觀、清晰。
figsize(width, height)設置圖的大小,linewidth設置線的寬度,fontsize設置字體大小。然后,調用set_title()方法設置標題。
ax = df.plot(color='blue', figsize=(8, 3), linewidth=2, fontsize=6) ax.set_title('399300.SZ close from 2005-01-04 to 2019-07-04', fontsize=8) plt.show()
如果想要看某一個子時間段內的折線變化情況,可以直接截取該時間段再作圖即可,如df['2018-01-01': '2019-01-01']
dfdf_subset_1 = df['2018-01-01':'2019-01-01'] ax = df_subset_1.plot(color='blue', fontsize=10) plt.show()
如果想要突出圖中的某一日期或者觀察值,可以調用.axvline()和.axhline()方法添加垂直和水平參考線。
ax = df.plot(color='blue', fontsize=6) ax.axvline('2019-01-01', color='red', linestyle='--') ax.axhline(3000, color='green', linestyle='--') plt.show()
也可以調用axvspan()的方法為一段時間添加陰影標注,其中alpha參數設置的是陰影的透明度,0代表完全透明,1代表全色。
ax = df.plot(color='blue', fontsize=6) ax.axvspan('2018-01-01', '2019-01-01', color='red', alpha=0.3) ax.axhspan(2000, 3000, color='green', alpha=0.7) plt.show()
3.移動平均時間序列
有時候,我們想要觀察某個窗口期的移動平均值的變化趨勢,可以通過調用窗口函數rolling來實現。下面實例中顯示的是,以250天為窗口期的移動平均線close,以及與移動標準差的關系構建的上下兩個通道線upper和lower。
ma = df.rolling(window=250).mean() mstd = df.rolling(window=250).std() ma['upper'] = ma['close'] + (mstd['close'] * 2) ma['lower'] = ma['close'] - (mstd['close'] * 2) ax = ma.plot(linewidth=0.8, fontsize=6) ax.set_xlabel('trade_date', fontsize=8) ax.set_ylabel('399300.SZ close from 2005-01-04 to 2019-07-04', fontsize=8) ax.set_title('Rolling mean and variance of 399300.SZ cloe from 2005-01-04 to 2019-07-04', fontsize=10) plt.show()
4.多個時間序列
如果想要可視化多個時間序列數據,同樣可以直接調用plot()方法。示例中我們從tushare.pro上面選取三只股票的日線行情數據進行分析。
# 獲取數據 code_list = ['000001.SZ', '000002.SZ', '600000.SH'] data_list = [] for code in code_list: print(code) df = pro.daily(ts_code=code, start_date='20180101', end_date='20190101')[['trade_date', 'close']] df.sort_values('trade_date', inplace=True) df.rename(columns={'close': code}, inplace=True) df.set_index('trade_date', inplace=True) data_list.append(df) df = pd.concat(data_list, axis=1) print(df.head()) 000001.SZ 000002.SZ 600000.SH 000001.SZ 000002.SZ 600000.SH trade_date 20180102 13.70 32.56 12.72 20180103 13.33 32.33 12.66 20180104 13.25 33.12 12.66 20180105 13.30 34.76 12.69 20180108 12.96 35.99 12.68 # 畫圖 ax = df.plot(linewidth=2, fontsize=12) ax.set_xlabel('trade_date') ax.legend(fontsize=15) plt.show()
調用.plot.area()方法可以生成時間序列數據的面積圖,顯示累計的總數。
ax = df.plot.area(fontsize=12) ax.set_xlabel('trade_date') ax.legend(fontsize=15) plt.show()
如果想要在不同子圖中單獨顯示每一個時間序列,可以通過設置參數subplots=True來實現。layout指定要使用的行列數,sharex和sharey用于設置是否共享行和列,colormap='viridis' 為每條線設置不同的顏色。
df.plot(subplots=True, layout=(2, 2), sharex=False, sharey=False, colormap='viridis', fontsize=7, legend=False, linewidth=0.3) plt.show()
看完上述內容,你們掌握Python中怎么實現時間序列可視化的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。