摘要:密度峰值聚类(density peaks clustering, DPC)算法通过考虑局部密度和相对距离来识别簇中心以实现聚类. 然而, 该算法在处理密度分布不均匀和类簇大小不平衡的数据时容易忽视低密度区域的类簇中心, 需要人为设定类簇数量, 并且其分配策略中一个数据点分配错误会导致后续点的错误分配. 为了解决上述问题, 本文提出一种自适应稀疏感知密度峰值聚类算法. 首先, 引入模糊点概念以降低对子簇合并过程的影响; 其次, 利用减法聚类方法识别低密度区域的中心; 然后, 根据新的局部密度和反向最近邻数来识别噪声并更新子簇中心; 最后, 给出改进的全局交叠度, 结合全局可分度指导子簇融合, 并在这些度量下自动确定聚类结果. 实验结果表明, 在合成数据集和UCI数据集上, 与DPC及其改进算法相比, 本文提出的算法能够更好地识别稀疏簇、减少非中心分配带来的连锁反应, 自动确定最优类簇数目并获得更加准确的聚类结果.