为了对internet上的半结构化数据进行分析,发现其内在的关联模式,论文提出了基于小波理论的web挖掘模型,该模型支持web挖掘的全过程。Web挖掘模型由数据采集器、预处理器、数据约简、挖掘综合器、挖掘方法库和系统维护六部分组成。该模型应用小波聚类分析方法,实现了对经过预处理的Web数据进行约简的功能。去除了一些冗余的无意义的数据,优化了系统的性能,提高了web挖掘质量。
邵良杉,刘飞飞.基于小波理论的Web挖掘模型研究.计算机系统应用,2008,17(4):19-22
京公网安备 11040202500063号