python聚类算法如何选择

866次阅读

没有评论

python聚类算法如何选择

说明

1、如果数据集是高维度的，选择谱聚类是子空间的一种。

2、如果数据量是中小型的，K均值会是更好的选择。

如果数据量超过100W条，可以考虑使用MiniBatchKMeans。

3、如果数据集中有噪声，选择DBSCAN。

使用基于密度的DBSCAN可以有效解决这个问题。

4、若追求更高的分类准确性，则选择谱聚类。

实例

import numpy as np
import matplotlib.pyplot as plt
 
 
# 数据准备
raw_data = np.loadtxt('./pythonlearn/cluster.txt') # 导入数据文件
X = raw_data[:, :-1] # 分割要聚类的数据
y_true = raw_data[:, -1]
 
print(X)

以上就是python聚类算法的选择方法，希望对大家有所帮助。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

发表于：django

2022-03-20

# Python算法

复制链接

赏

新手QQ群：570568346，欢迎进群讨论

python协程和线程的差异

python中DataFrame的运算总结

天启|企业级代理IP免费测试>>>>>神龙|纯净稳定代理IP免费测试>>>>>IPIPGO|全球住宅代理IP免费测试>>>>>神龙|国外动态代理IP免费测试>>>>>LoongProxy|全球静态代理IP免费测试>>>>>全民|国内代理IP免费测试

python聚类算法如何选择

相关文章：

HTTP代理设置详解：一步步配置指南

什么是Socks5代理IP及其优势

Socks5代理配置教程及注意事项

什么是代理服务器IP：如何选择合适的

国外代理服务器的优势及选择建议

如何找到可靠的免费代理服务器

在线代理服务器的使用与推荐

HTTP代理服务器的设置及应用实例

静态代理IP怎么填写：步骤与示例

海外静态IP的代理选择与配置