在Matlab中,kmeans函數用于執行k均值聚類算法。它的語法如下:
[idx, C] = kmeans(X, k)
其中,X是一個m×n的矩陣,表示包含m個樣本的數據集,每個樣本有n個特征;k是要分成的聚類數目;idx是一個m×1的向量,表示每個樣本所屬的聚類索引;C是一個k×n的矩陣,表示每個聚類的中心點。
kmeans函數通過迭代將數據集劃分成k個聚類,每個聚類用一個中心點表示。它使用歐幾里得距離來度量樣本之間的相似性,并嘗試最小化樣本到其所屬聚類中心的距離之和。
使用kmeans函數的步驟如下:
以下是一個示例:
data = [1,2; 2,1; 4,5; 5,4; 8,9; 9,8];
k = 2;
[idx, C] = kmeans(data, k);
在這個示例中,數據集data有6個樣本,每個樣本有2個特征。我們將數據集分成2個聚類。最后,idx將包含每個樣本所屬的聚類索引,C將包含兩個聚類的中心點。