大數據開發中常見的聚類算法有哪些

發布時間：2022-01-14 14:34:55 來源：億速云閱讀：201 作者：小新欄目：大數據

小編給大家分享一下大數據開發中常見的聚類算法有哪些，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

· 常見的聚類算法 ·

K-Means

(K均值)聚類

算法步驟

(1) 首先我們選擇一些類/組，并隨機初始化它們各自的中心點。中心點是與每個數據點向量長度相同的位置。這需要我們提前預知類的數量(即中心點的數量)。

(2) 計算每個數據點到中心點的距離，數據點距離哪個中心點最近就劃分到哪一類中。

(3) 計算每一類中中心點作為新的中心點。

(4) 重復以上步驟，直到每一類中心在每次迭代后變化不大為止。也可以多次隨機初始化中心點，然后選擇運行結果最好的一個。

下圖演示了K-Means進行分類的過程：

大數據開發中常見的聚類算法有哪些

優點：

速度快，計算簡便

缺點：

我們必須提前知道數據有多少類/組。

K-Medians是K-Means的一種變體，是用數據集的中位數而不是均值來計算數據的中心點。

K-Medians的優勢是使用中位數來計算中心點不受異常值的影響；缺點是計算中位數時需要對數據集中的數據進行排序，速度相對于K-Means較慢。

2. 均值漂移聚類

3. 基于密度的聚類方法(DBSCAN)

4. 用高斯混合模型（GMM）的最大期望（EM）聚類

5. 凝聚層次聚類

6. 圖團體檢測(Graph Community Detection)

其他的算法可以查看：

https://blog.csdn.net/Katherine_hsr/article/details/79382249

K-mean聚類

代碼實現

1、導入數據

大數據開發中常見的聚類算法有哪些

2、計算每個數據點到中心點的距離

大數據開發中常見的聚類算法有哪些

3、對數據點分組

大數據開發中常見的聚類算法有哪些

4、迭代收斂和更新質心

大數據開發中常見的聚類算法有哪些

結果圖展示：

大數據開發中常見的聚類算法有哪些

相似的代碼和演示的數據都上傳到了網盤，大家可以去下載、嘗試和應用到自己的項目中。

以上是“大數據開發中常見的聚類算法有哪些”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

大數據開發中常見的聚類算法有哪些

K-Means

(K均值)聚類

2. 均值漂移聚類

3. 基于密度的聚類方法(DBSCAN)

4. 用高斯混合模型（GMM）的最大期望（EM）聚類

5. 凝聚層次聚類

6. 圖團體檢測(Graph Community Detection)

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

大數據開發中常見的聚類算法有哪些

K-Means

(K均值)聚類

2. 均值漂移聚類

3. 基于密度的聚類方法(DBSCAN)

4. 用高斯混合模型（GMM）的最大期望（EM）聚類

5. 凝聚層次聚類

6. 圖團體檢測(Graph Community Detection)

猜你喜歡

最新資訊

相關推薦

相關標簽