###
DOI:
计算机系统应用英文版:2009,18(3):73-75
本文二维码信息
码上扫一扫!
一种基于Hash函数抽样的数据流聚类算法
(中南大学 信息科学与工程学院 湖南 长沙 410083)
A DataStream Clustering Algorithm Based on Hash Sampling
摘要
图/表
参考文献
相似文献
本文已被:浏览 1807次   下载 4275
Received:September 06, 2008    
中文摘要: 近几年来由于数据流应用的大量涌现,基于数据流的数据挖掘算法已成为重要的研究课题,而现有的数据流聚类算法Clustream算法存在效率低,对大数据集适应性差等严重不足,本文提出了一种基于Hash函数抽样的数据流聚类算法。算法采用等时间跨度滑动窗口的思想,对每个窗口内的数据首先用Hash函数进行抽样,抽样后的数据先保存在存储池中,然后分析样本数据的变化情况,再利用PAM算法得到最终的聚类结果。从对真实数据集的实验结果上来看,算法具有良好的可行性和有效性,且在大规模数据处理的情况下,效率远高于Clustream
Abstract:
keywords:
文章编号:     中图分类号:    文献标志码:
基金项目:
引用文本:
张驹,黄汉永,肖杰.一种基于Hash函数抽样的数据流聚类算法.计算机系统应用,2009,18(3):73-75
.A DataStream Clustering Algorithm Based on Hash Sampling.COMPUTER SYSTEMS APPLICATIONS,2009,18(3):73-75