首页 >>  正文

k-means原理

来源:baiyundou.net   日期:2024-09-21

臧策贺2637如何确定k - means最佳聚类数 -
应黎毛18517004076 ______ 凭经验,或给定其他条件来定,如类间距必须大于多少?不同类间样本距离必须大于多少?类中样本数必须大于多少?

臧策贺2637K - means的存在问题 -
应黎毛18517004076 ______ 存在的问题 K-means 算法的特点——采用两阶段反复循环过程算法,结束的条件是不再有数据元素被重新分配: 优点:本算法确定的K 个划分到达平方误差最小.当聚类是密集的,且类与类之间区别明显时,效果较好.对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为O(NKt),其中N是数据对象的数目,t是迭代的次数.一般来说,K<<

臧策贺2637简述K - means算法的基本过程及其不足.《数据挖掘》作业题追分100 -
应黎毛18517004076 ______[答案] 1、 从 n个数据对象任意选择 k 个对象作为初始聚类中心;2、 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;3、 重新计算每个(有变化)聚类的均值...

臧策贺2637评价一个聚类质量算法需要哪些值 -
应黎毛18517004076 ______ 1)芮氏指标(简称RI)2))归一化互信息(简称NMI)

臧策贺2637K - means的算法缺点 -
应黎毛18517004076 ______ ① 在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的.很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适.这也是 K-means 算法的一个不足.有的算法是通过类的自动合并和分裂,得到较为合理的类型...

臧策贺2637k - means算法解决了什么问题 -
应黎毛18517004076 ______ k-means算法是聚类算法,比如一群混乱的粒子(共3大类,混在了一起,不作处理分不开),这个时候通过K-means聚类就可以将它们给分成3大类,达到分类的效果

臧策贺2637k - means算法什么时候被提出 -
应黎毛18517004076 ______ 1967年

臧策贺2637k - means 聚类算法处理什么类型数据 -
应黎毛18517004076 ______ 这个问题其实是无解的,数据不同,算法的分类效果、实际运行时间也是不同.若单从运算速度而言,k-means比层次更快.原因是K-means是找中心,然后计算距离;层次是逐个样本逐层合并,层次的算法复杂度更高.更重要的是,在大数量下,K-means算法和层次聚类算法的分类效果真的只能用见仁见智来形容了.

臧策贺2637如何使用K - MEANS聚类算法解决分类问题 -
应黎毛18517004076 ______ K-means 算法属于聚类分析方法中一种基本的且应用最广泛的划分算法,它是一种已知聚类类别数的聚类算法.指定类别数为K,对样本集合进行聚类,聚类的结果由K 个聚类中心来表达,基于给定的聚类目标函数(或者说是聚类效果判别准则),算法采用迭代更新的方法,每一次迭代过程都是向目标函数值减小的方向进行,最终的聚类结果使目标函数值取得极小值,达到较优的聚类效果.使用平均误差准则函数E作为聚类结果好坏的衡量标准之一,保证了算法运行结果的可靠性和有效性.

臧策贺2637对一组数据进行k - means聚类,得到的各个类的质点仍是原数据集合中的成员吗?
应黎毛18517004076 ______ k-means意思就是K个类的均值向量(质心),通常不是原数据集合中的成员,但也有用一个实际成员作类中心来聚类的做法.

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024