基于网络社区发现的标签传播聚类算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

福建省自然科学基金(2019J01835); 认知计算与智能信息处理福建省高校重点实验室开放课题基金(KLCCIIP2018107); 智慧农林福建省高校重点实验室开放课题基金(2019LSAF03); 福建省中青年教师教育科研项目(JAT170608); 中央引导地方科技专项(2018L3013); 武夷学院校科研基金(XL1201)


Label Propagation Clustering Algorithm Based on Network Community Detection
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    高维数据的聚类特性通常难以直接观测. 将其构建为复杂网络, 节点间的拓扑结构可以反映样本之间的关系. 对网络中的节点进行社区发现, 可实现对数据更直观的聚类. 提出一种基于网络社区发现的低随机性标签传播聚类算法. 首先, 用半径和最近邻方法将数据集构建为稀疏的全连通网络. 之后, 根据节点相似度进行节点标签预处理, 使得相似的节点具有相同的标签. 用节点的影响力值改进标签传播过程, 降低标签选择的随机性. 最后, 基于内聚度进行社区的优化合并, 提高社区的质量. 在真实数据集和人工数据集上的实验结果表明, 该算法对各种类型的数据都具有较好的适应性.

    Abstract:

    The clustering characteristics of high-dimensional data are usually difficult to observe directly. Constructing it into a complex network, the topological structure of the network nodes can reflect the relationship between samples. Community detection of nodes in the network can achieve more intuitive clustering of data. A low randomness label propagation clustering algorithm based on network community detection is proposed. First, the data set is constructed as a sparse fully connected network using the radius and nearest neighbor methods. Then, according to the similarity of the nodes, the node labels are preprocessed to make the similar nodes have the same labels. The influence value of the nodes is used to improve the label propagation process and reduce the randomness of label selection. Finally, based on the cohesion, the community is optimized and merged to improve the quality of the community. The experimental results on real data sets and artificial data sets show that the algorithm has better adaptability to all kinds of data.

    参考文献
    相似文献
    引证文献
引用本文

吴清寿,郭磊,余文森.基于网络社区发现的标签传播聚类算法.计算机系统应用,2020,29(12):135-143

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-04-24
  • 最后修改日期:2020-05-21
  • 录用日期:
  • 在线发布日期: 2020-12-02
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号