python如何做聚类分析(利用Python实现聚类分析)

2023年 7月 30日开发运维醒在深海的猫

要使用Python进行聚类分析，可以使用scikit-learn库。s

cikit-learn是一个流行的机器学习库，提供了许多聚类算法，如K-means、DBSCAN和层次聚类等。

在这个示例中，我们将展示如何使用K-means算法进行聚类分析。

首先，确保安装了scikit-learn库。

如果尚未安装，请运行以下命令：

pip install scikit-learn

接下来，我们将使用一个简单的示例数据集并执行K-means聚类。

import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# 示例数据集
data = np.array([
    [1, 2], [1.5, 1.8], [5, 8], [8, 8],
    [1, 0.6], [9, 11], [8, 2], [10, 2],
    [9, 3]
])

# 设置聚类数量
num_clusters = 3

# 创建KMeans模型
kmeans = KMeans(n_clusters=num_clusters)

# 训练模型并进行预测
kmeans.fit(data)
labels = kmeans.predict(data)

# 输出聚类结果
print("Cluster labels:", labels)

# 可视化聚类结果
for i in range(num_clusters):
    cluster_data = data[labels == i]
    plt.scatter(cluster_data[:, 0], cluster_data[:, 1], label=f'Cluster {i + 1}')

plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], marker='x', color='black', label='Centroids')
plt.legend()
plt.show()

在这个示例中，我们首先导入所需的库（numpy、sklearn.cluster和matplotlib.pyplot），然后创建一个示例数据集。

我们设置聚类数量（num_clusters）为3，然后使用K-means算法创建一个模型。

我们训练模型（kmeans.fit(data)）并预测聚类标签（kmeans.predict(data)）。

最后，我们输出聚类标签并使用matplotlib库可视化结果，这将显示每个数据点的聚类分配和聚类中心。

图片[1]-python如何做聚类分析(利用Python实现聚类分析)-不念博客