Skip to content

Cassiel-Pyj/Clustering_program

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Clustering_programs

2018.3.1-2018.5.20 完成的本科毕业设计(聚类算法及应用)
主要工作:
经典常见的五种聚类算法的实验,包括:
1、基于代表的聚类(K-means及其三个变体:二分K-means 、 K-means++、K-medoids 、核K-means)
2、基于概率模型的聚类(高斯混合聚类)
3、基于层次的聚类Agglomerative
4、基于密度的聚类(DBSCAN)、谱聚类
5、图像的RGB像素的聚类应用实验
阅读了2篇有关半监督层次聚类和密度聚类的文献,掌握HCAC(基于信心和主动学习的半监督层次聚类)和快速搜索与密度聚类算法的原理,并编程实现和验证。
结合已有理论基础,对高斯混合EM模型进行改进,解决该算法随机初始均值的敏感性,并加入噪声点检测。
用python进行编程实验,用UCI标准数据集及人造数据集进行算法的有效性验证并比较各个算法的优劣及特点,使用聚类性能的度量指标进行效果的验证。
注:图像的RGB像素的聚类应用实验参考网络博客https://blog.csdn.net/GarfieldEr007/article/details/50441907https://blog.csdn.net/GarfieldEr007/article/details/50441907
K-means和二分K-means代码参考《机器学习实战》,其余都根据算法自己编程,但是个人能力有限,代码会有冗余和重复,有些地方设计地不合理,请见谅
实际的数据可以根据自己的需要寻找网络上开放的资源或文献中作者所给的数据集
代码仅供学习参考,所有代码已提交学校,论文已入大学生毕业论文库,请勿二次转载或抄袭!

About

2018.3.1-2018.5.20 完成的本科毕业设计(聚类算法及应用)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages