基于KD树改进的DBSCAN聚类算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Improved DBSCAN Clustering Algorithm Based on KD Tree
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    针对DBSCAN聚类算法随着数据量增大, 耗时越发非常严重的问题, 提出一种基于KD树改进的DBSCAN算法(以下简称KD-DBSCAN). 通过KD树对数据集进行划分, 构造邻域对象集, 提前区分出噪声点和核心点, 避免聚类过程中对噪声的邻域集计算以及加快了核心点对象的邻域集查询速度. 文中以浮动车GPS数据为实验数据, 对比传统DBSCAN算法和KD-DBSCAN算法的聚类效果和时间性能, 实验结果表明KD-DBSCAN算法的聚类效果和传统的DBSCAN基本一致, 但时间性能有很大的提升.

    Abstract:

    To tackle the problem that density-based spatial clustering of applications with noise (DBSCAN) clustering algorithm is increasingly time-consuming with the increase in data volume, this study proposes an improved DBSCAN algorithm based on a K-dimensional (KD) tree (hereinafter referred to as KD-DBSCAN). The KD tree is used to divide the data set, construct the neighborhood object set, and distinguish the noise point and the core point in advance to avoid the calculation of the noise neighborhood set in the clustering process and speed up the neighborhood set query of the core point object. In this study, the global positioning system (GPS) data of a floating car is used as experimental data to compare the traditional DBSCAN algorithm and KD-DBSCAN algorithm in aspects of the clustering effect and time performance. The experimental results show that the KD-DBSCAN algorithm is comparable to the traditional DBSCAN algorithm in the clustering effect but has greatly improved time performance.

    参考文献
    相似文献
    引证文献
引用本文

陈文龙,时宏伟.基于KD树改进的DBSCAN聚类算法.计算机系统应用,2022,31(2):305-310

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-04-19
  • 最后修改日期:2021-05-19
  • 录用日期:
  • 在线发布日期: 2022-01-28
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号