Scikit-learn中怎么实现层次聚类

在Scikit-learn中,可以使用AgglomerativeClustering类来实现层次聚类。具体步骤如下:

导入所需的库:

from sklearn.cluster import AgglomerativeClustering

实例化AgglomerativeClustering类,并设置参数:

# n_clusters表示要聚类的簇数
# linkage表示要使用的链接标准,可以是'ward', 'complete', 'average', 'single'
# 具体参数可参考官方文档:https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
clustering = AgglomerativeClustering(n_clusters=2, linkage='ward')

使用fit_predict方法进行拟合和预测:

# X为数据集
labels = clustering.fit_predict(X)

最后,可以通过labels属性获取每个样本所属的簇:

print(labels)

这样就可以使用Scikit-learn实现层次聚类了。

阅读剩余
THE END