基于Hadoop的改进型遗传聚类算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(61702093); 东北石油大学青年科学基金(2020QNL-02)


Improved Genetic Clustering Algorithm Based on Hadoop
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    针对经典K-means聚类算法存在易陷入局部最优解的缺点, 提出并实现了一种基于Hadoop的改进型遗传聚类算法. 该算法利用遗传算法具有全局性和并行性的特点去处理K-means聚类算法易陷入局部最优的缺点, 在此基础上对遗传算法进行改进, 然后将改进后的遗传算法与K-means算法相结合, 为提高算法执行效率, 将其基于Hadoop平台进行了实现. 通过实验将该改进方法与经典聚类算法进行对比分析, 实验结果表明该方法在聚类准确性和聚类效率上均有较大的提高.

    Abstract:

    Concerning the shortcoming that the classical K-means clustering algorithm is easy to fall into the local optimum, an improved genetic clustering algorithm based on Hadoop is proposed and implemented. The algorithm overcomes the above shortcoming with the globality and parallelism of the genetic algorithm. On this basis, the genetic algorithm is improved and then combined with the classical K-means algorithm. To improve the implementation efficiency, we implement the improved genetic clustering algorithm on Hadoop. The proposed method is compared with the classical clustering algorithm through experiments. The results show that the proposed method can greatly improve the clustering accuracy and efficiency.

    参考文献
    相似文献
    引证文献
引用本文

潘俊辉,王辉,张强,王浩畅.基于Hadoop的改进型遗传聚类算法.计算机系统应用,2021,30(9):242-246

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-11-17
  • 最后修改日期:2020-12-21
  • 录用日期:
  • 在线发布日期: 2021-09-04
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号