摘要:针对DBSCAN聚类算法随着数据量增大, 耗时越发非常严重的问题, 提出一种基于KD树改进的DBSCAN算法(以下简称KD-DBSCAN). 通过KD树对数据集进行划分, 构造邻域对象集, 提前区分出噪声点和核心点, 避免聚类过程中对噪声的邻域集计算以及加快了核心点对象的邻域集查询速度. 文中以浮动车GPS数据为实验数据, 对比传统DBSCAN算法和KD-DBSCAN算法的聚类效果和时间性能, 实验结果表明KD-DBSCAN算法的聚类效果和传统的DBSCAN基本一致, 但时间性能有很大的提升.