91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何使用Python創建一個瀑布圖

發布時間:2022-06-01 14:48:37 來源:億速云 閱讀:170 作者:iii 欄目:大數據

今天小編給大家分享一下如何使用Python創建一個瀑布圖的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。

創建圖表

首先,執行標準的輸入,并確保IPython能顯示matplot圖。

import numpy as np import pandas as pd import matplotlib.pyplot as plt
%matplotlib inline

設置我們想畫出瀑布圖的數據,并將其加載到數據幀(DataFrame)中。

數據需要以你的起始值開始,但是你需要給出最終的總數。我們將在下面計算它。

index = ['sales','returns','credit fees','rebates','late charges','shipping'] data = {'amount': [350000,-30000,-7500,-25000,95000,-7000]} trans = pd.DataFrame(data=data,index=index)

我使用了IPython中便捷的display函數來更簡單地控制我要顯示的內容。

  1. from IPython.display import display 

  2. display(trans)

首先,我們得到累積和。

display(trans.amount.cumsum())  sales 350000  returns 320000  credit fees 312500  rebates 287500  late charges 382500  shipping 375500  Name: amount, dtype: int64

這看起來不錯,但我們需要將一個地方的數據轉移到右邊。

  1. blank=trans.amount.cumsum().shift(1).fillna(0) 

  2.  

  3. display(blank)

sales 0  returns 350000  credit fees 320000  rebates 312500  late charges 287500  shipping 382500  Name: amount, dtype: float64

我們需要向trans和blank數據幀中添加一個凈總量。

total = trans.sum().amount  trans.loc["net"] = total  blank.loc["net"] = total  display(trans)  display(blank)
sales 0  returns 350000  credit fees 320000  rebates 312500  late charges 287500  shipping 382500  net 375500  Name: amount, dtype: float64

創建我們用來顯示變化的步驟。

  1. step = blank.reset_index(drop=True).repeat(3).shift(-1) 

  2.  

  3. step[1::3] = np.nan 

  4.  

  5. display(step)

0 0  0 NaN  0 350000  1 350000  1 NaN  1 320000  2 320000  2 NaN  2 312500  3 312500  3 NaN  3 287500  4 287500  4 NaN  4 382500  5 382500  5 NaN  5 375500  6 375500  6 NaN  6 NaN  Name: amount, dtype: float64

對于“net”行,為了不使堆疊加倍,我們需要確保blank值為0。

blank.loc["net"] = 0

然后,將其畫圖,看一下什么樣子。

  1. my_plot = trans.plot(kind='bar', stacked=True, bottom=blank,legend=None, title="2014 Sales Waterfall") 

  2. my_plot.plot(step.index, step.values,'k')

看起來相當不錯,但是讓我們試著格式化Y軸,以使其更具有可讀性。為此,我們使用FuncFormatter和一些Python2.7+的語法來截斷小數并向格式中添加一個逗號。

  1. def money(x, pos): 

  2.  

  3. 'The two args are the value and tick position' 

  4.  

  5. return "${:,.0f}".format(x)

from matplotlib.ticker import FuncFormatter formatter = FuncFormatter(money)

然后,將其組合在一起。

  1. my_plot = trans.plot(kind='bar', stacked=True, bottom=blank,legend=None, title="2014 Sales Waterfall") 

  2.  

  3. my_plot.plot(step.index, step.values,'k') 

  4.  

  5. my_plot.set_xlabel("Transaction Types") 

  6.  

  7. my_plot.yaxis.set_major_formatter(formatter)

完整腳本

基本圖形能夠正常工作,但是我想添加一些標簽,并做一些小的格式修改。下面是我最終的腳本:

import numpy as np  import pandas as pd  import matplotlib.pyplot as plt  from matplotlib.ticker import FuncFormatter     #Use python 2.7+ syntax to format currency  def money(x, pos):  'The two args are the value and tick position'  return "${:,.0f}".format(x)  formatter = FuncFormatter(money)     #Data to plot. Do not include a total, it will be calculated  index = ['sales','returns','credit fees','rebates','late charges','shipping']  data = {'amount': [350000,-30000,-7500,-25000,95000,-7000]}     #Store data and create a blank series to use for the waterfall  trans = pd.DataFrame(data=data,index=index)  blank = trans.amount.cumsum().shift(1).fillna(0)     #Get the net total number for the final element in the waterfall  total = trans.sum().amount  trans.loc["net"]= total  blank.loc["net"] = total     #The steps graphically show the levels as well as used for label placement  step = blank.reset_index(drop=True).repeat(3).shift(-1)  step[1::3] = np.nan     #When plotting the last element, we want to show the full bar,  #Set the blank to 0  blank.loc["net"] = 0     #Plot and label  my_plot = trans.plot(kind='bar', stacked=True, bottom=blank,legend=None, figsize=(10, 5), title="2014 Sales Waterfall")  my_plot.plot(step.index, step.values,'k')  my_plot.set_xlabel("Transaction Types")     #Format the axis for dollars  my_plot.yaxis.set_major_formatter(formatter)     #Get the y-axis position for the labels  y_height = trans.amount.cumsum().shift(1).fillna(0)     #Get an offset so labels don't sit right on top of the bar  max = trans.max()  neg_offset = max / 25  pos_offset = max / 50  plot_offset = int(max / 15)     #Start label loop  loop = 0  for index, row in trans.iterrows():  # For the last item in the list, we don't want to double count  if row['amount'] == total:  y = y_height[loop]  else:  y = y_height[loop] + row['amount']  # Determine if we want a neg or pos offset if row['amount'] > 0:  y += pos_offset  else:  y -= neg_offset  my_plot.annotate("{:,.0f}".format(row['amount']),(loop,y),ha="center")  loop+=1     #Scale up the y axis so there is room for the labels  my_plot.set_ylim(0,blank.max()+int(plot_offset))  #Rotate the labels  my_plot.set_xticklabels(trans.index,rotation=0)  my_plot.get_figure().savefig("waterfall.png",dpi=200,bbox_inches='tight')

以上就是“如何使用Python創建一個瀑布圖”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

九龙县| 凤台县| 若羌县| 观塘区| 遵义市| 罗山县| 宜宾市| 桃园市| 旺苍县| 大安市| 临沭县| 高阳县| 贵阳市| 溧水县| 佛坪县| 宿迁市| 华阴市| 杨浦区| 子洲县| 界首市| 个旧市| 沙田区| 汨罗市| 沐川县| 驻马店市| 叶城县| 安溪县| 乳山市| 贡觉县| 文山县| 宁明县| 吉林市| 洪洞县| 石嘴山市| 左贡县| 婺源县| 河北区| 容城县| 巴中市| 商城县| 会昌县|