91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

該用Python還是SQL?4個案例教你節省時間

發布時間:2020-07-31 07:51:52 來源:網絡 閱讀:256 作者:Python熱愛者 欄目:編程語言

在數據分析行業,對數據提出的每一個問題都可以用多種潛在的語言和工具包來回答。每種語言都有其優勢,它們之間也存在著不同的區別。不能否認的是,有些操作用Python執行起來要比SQL更加高效。這篇文章分享了4個能夠節省時間的案例,在這幾個案例中,Python在探索和分析數據集方面遠遠優于SQL。

描述性統計

假設你正在探索新的數據集,可以使用許多不同的方法來統計描述這些數據,并得到總體感知。例如:

· 計數

· 平均值

· 標準偏差

· 最小值

· 第一四分位數

· 第二四分位數(中位數)

· 第三四分位數

· 最大值

要想在SQL中得到以上信息,你需要輸入:


該用Python還是SQL?4個案例教你節省時間

但也許你并不想輸入以上所有代碼。你可以使用pandas的DataFrame.describe()函數來得出基礎數據集的基本描述性統計信息。

datasets['Python Input'].describe().round(1)

查看此報告并仿照該報告自行探索描述性統計。

移動平均值

假設你現在想計算移動平均值,以便于在輸入不斷變化的情況下得到其明確的平均值。移動平均值有助于消除數據驟降和峰值的影響,從而使長期趨勢更加顯而易見。

在SQL中,你可以輸入這樣的查詢(query):


該用Python還是SQL?4個案例教你節省時間

在Python中,只需以下代碼便可快速得到相同的兩周移動平均值:


該用Python還是SQL?4個案例教你節省時間

另外,Python能夠進一步實現可視化。

樞軸

要想重新排列數據與樞軸以繪制圖表或是演示文稿格式,在SQL中需要幾個步驟才能實現。在這個案例中,需要將Mode Public Warehouse中大學橄欖球運動員的數據集從行樞軸轉換到列樞軸。

首先,要匯總每年、每場比賽的運動員的信息來準備數據。


該用Python還是SQL?4個案例教你節省時間

轉換數據之后,需要將查詢(query)嵌入子查詢(subquery)中。


該用Python還是SQL?4個案例教你節省時間

接下來,如果你想將結果按照年份分成幾列,可以用SELECT語句為每個項單獨創建列。


該用Python還是SQL?4個案例教你節省時間

雖然這能使你很好地控制查詢和進程,但是用Python操作實則要更加輕松。當你從年份和比賽中SELECT大學橄欖球運動員后,可以跳轉到Notebook并運行DataFrame.pivot。你能根據列值重塑數據,因而可以重新排列結果集。

DataFrame.pivot

自連接

在很多情況下,你可能想要將一個表與其自身連接起來。要想創建自連接(self join),需要先輸入此查詢,以便為同一張表創建不同的引用名稱。


該用Python還是SQL?4個案例教你節省時間

在pandas中,我們可以這樣實現:


該用Python還是SQL?4個案例教你節省時間

想自己嘗試建立自連接嗎?仿照這篇報告來撰寫你的個人Mode報告吧!


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阜新市| 江源县| 宜宾市| 阿巴嘎旗| 南部县| 田东县| 双城市| 东海县| 吉林省| 南昌市| 鄱阳县| 科技| 江津市| 巴彦淖尔市| 连江县| 都安| 谷城县| 七台河市| 萝北县| 江永县| 延边| 逊克县| 嘉禾县| 来凤县| 三原县| 阿克苏市| 辽阳县| 丹江口市| 阿克陶县| 柏乡县| 太原市| 介休市| 西青区| 山东| 越西县| 永平县| 岳普湖县| 彭山县| 广灵县| 乡城县| 田林县|