91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hive中的中位數是什么

發布時間:2021-07-12 09:27:56 來源:億速云 閱讀:154 作者:chen 欄目:大數據

本篇內容主要講解“Hive中的中位數是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Hive中的中位數是什么”吧!

關于求解中位數,我們知道在Python中直接有中位數處理函數(mean),比如在Python中求解一個中位數,代碼很簡單。

Python計算中位數

import numpy as np

nums = [1.1,2.2,3.3,4.4,5.5,6.6]

#均值

np.mean(nums)

#中位數

np.median(nums)

在hive中沒有直接提供相關的mean函數,但官方提供了兩個UDAF,percentile和percentile_approx。

我們看下官方是怎么說的

DOUBLEpercentile(BIGINT col, p)Returns the exact pthpercentile of a  column in the group (does not work with floating point types). p must be  between 0 and 1. NOTE: A true percentile can only be computed for integer  values. Use PERCENTILE_APPROX if your input is non-integral.

arraypercentile(BIGINT col, array(p1[, p2]...))Returns the exact percentiles p1, p2,  ... of a column in the group (does not work with floating point types). pimust  be between 0 and 1. NOTE: A true percentile can only be computed for integer  values. Use PERCENTILE_APPROX if your input is non-integral.

DOUBLEpercentile_approx(DOUBLE col, p [, B])Returns an approximate pthpercentile of  a numeric column (including floating point types) in the group. The B  parameter controls approximation accuracy at the cost of memory. Higher  values yield better approximations, and the default is 10,000. When the  number of distinct values in col is smaller than B, this gives an exact  percentile value.

arraypercentile_approx(DOUBLE col, array(p1[,  p2]...) [, B])Same as above, but accepts and returns an array of  percentile values instead of a single one.

請注意,官方文檔上說了一句話:NOTE: A true percentile can only be computed for integer values. Use

PERCENTILE_APPROX if your input is non-integral.

也就是說,真正的中位數只能用percentile來計算,輸入需要為整數類型,使用percentile_approx(輸入為浮點型)計算得到的并不是真正的中位數,也就是所說的近似中位數,經過大量數據驗證,有時候這個近似中位數和真正的中位數差別還是很大的。

如何對有小數的數據求取中位數呢?

可以把小數轉換為整數,然后再求取中位數(如先??乘10000)

sparksql中也是如此求取中位數的,趕快去試一試吧!

到此,相信大家對“Hive中的中位數是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

南江县| 栾川县| 荆州市| 涟源市| 资阳市| 安化县| 古浪县| 开鲁县| 关岭| 汕尾市| 侯马市| 平罗县| 桐庐县| 长顺县| 林西县| 寿光市| 板桥市| 闻喜县| 丹东市| 青冈县| 兖州市| 河南省| 临桂县| 平远县| 黄石市| 庆安县| 涞水县| 泽库县| 太白县| 郧西县| 克什克腾旗| 綦江县| 黄冈市| 临江市| 荔波县| 高青县| 镇赉县| 会理县| 广德县| 仙桃市| 荥经县|