重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
今天给大家介绍一下K-means聚类中的Kmeans Clustering该如何理解。文章的内容小编觉得不错,现在给大家分享一下,觉得有需要的朋友可以了解一下,希望对大家有所帮助,下面跟着小编的思路一起来阅读吧。
目前创新互联建站已为1000多家的企业提供了网站建设、域名、网页空间、网站托管、企业网站设计、汉阳网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。
Kmeans算法是将一些杂乱无章的数,分为若干个类的一种聚类方法
算法步骤:(k表示聚类中心的个数,上图为3)
(1)随机选取任意k个对象作为初始聚类中心,初始代表一个簇;
(2)计算点到质心的距离,并把它归到最近的质心的类;
(3)重新计算已经得到的各个类的质心;
(4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束。
K-means算法的优缺点:
1.效果好,不易受初始值得影响
2.不能处理非球形的簇
3.不能处理不同尺寸,不同密度的簇
4.容易受孤立点的影响(需要我们人为干预,进行剔除)
常用的距离算法:
1.欧几里得距离
2.余弦相似度
以上就是K-means聚类中的Kmeans Clustering该如何理解的全部内容了,更多与K-means聚类中的Kmeans Clustering该如何理解相关的内容可以搜索创新互联之前的文章或者浏览下面的文章进行学习哈!相信小编会给大家增添更多知识,希望大家能够支持一下创新互联!