查询结果:   李顺勇,张苗苗.一种带权的混合数据聚类个数确定算法[J].计算机应用与软件,2019,36(1):284 - 290.
中文标题
一种带权的混合数据聚类个数确定算法
发表栏目
算法
摘要点击数
46
英文标题
A WEIGHTED CLUSTERING NUMBER DETERMINING ALGORITHM FOR MIXED DATA
作 者
李顺勇 张苗苗 Li Shunyong Zhang Miaomiao
作者单位
山西大学数学科学学院 山西 太原 030006     
英文单位
School of Mathematical Sciences, Shanxi University, Taiyuan 030006, Shanxi, China     
关键词
聚类个数 混合数据 属性权重 有效性指标
Keywords
The number of clustering Mixed data Attribute weight Validity index
基金项目
国家自然科学基金项目(61573229);山西省基础研究计划项目(201701D121004);山西省回国留学人员科研项目(2017-020);山西省高等学校教学改革创新项目(J2017002)
作者资料
李顺勇,副教授,主研领域:统计机器学习。张苗苗,硕士生。 。
文章摘要
混合数据的聚类过程中通常面临一个不可回避的问题:聚类个数的确定。基于Liang k-prototype算法引入属性权重,重新定义混合数据缺失某类的类间熵和(SBAE_M)、有效性指标(CUM) 及相异性度量。提出一种带权的混合数据聚类个数确定算法。该算法的基本思想是:用newk-prototype算法将混合数据进行聚类,计算其聚类结果的CUM及SBAE_M,将最坏的类剔除,并将该类中的对象用新的相异性度量进行重新分配,CUM最大时包含的类别数即为聚类个数。在5个UCI数据集上验证了该算法的有效性。
Abstract
Determining the number of clusters is an unavoidable problem in the clustering process of mixed data.This paper introduced attribute weight on the basis of Liang k-prototype algorithm,redefined the sum of between-cluster entropies in absence of a cluster(SBAE_M), the validity index(CUM) and the dissimilarity measure of mixed data, and proposedaweighted algorithm for determining the number of mixed data clustering.New k-prototype algorithm was used to cluster the mixed data.CUM and SBAE_M of the clustering results were calculated and the worst class was eliminated. The objects in this class were reassigned with new dissimilarity measure.The number of categoriesincluding at the maximum of CUM was the number of clusters.The effectiveness of the improved k-prototype clustering algorithm was verified on five data sets from UCI.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
一种带权的混合数据聚类个数确定算法
李顺勇
算法
2019
1
284
[摘要]
2
光电混合数据中心网络负载均衡流量调度机制
蔡岳平
网络与通信
2017
8
145
[摘要]
3
基于实时多业务的异构网络接入选择算法
蒋溢
网络与通信
2016
12
98
[摘要]
4
自动属性加权的K-调和均值聚类算法
范桂明
算法
2016
11
234
[摘要]
5
改进的二分K均值聚类算法
刘广聪
算法
2015
2
261
[摘要]
6
一种基于连通性的聚类有效性评价指标
蔡昌许
算法
2015
11
285
[摘要]
7
一种基于划分的混合数据聚类算法
常茜茜
人工智能与识别
2014
6
154
[摘要]
8
一种基于网络社团结构和模块化函数的聚类算法
沙爱晖
算法
2014
4
274
[摘要]
9
基于粗糙集理论的高校教师教学质量评价系统研究
李建林
应用技术与研究
2014
3
59
[摘要]
10
基于半监督聚类云模型动态加权的入侵检测方法
张杰
信息技术交流
2014
3
322
[摘要]
11
RS-CSA在网络故障诊断中的算法研究
韩炳山
应用技术与研究
2014
2
77
[摘要]