一种基于组合方式改进的频繁项集挖掘算法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

重庆市自然科学基金(CSTC,2007BB6118);中国博士后科学基金(20080430750)


An Improved Frequent Itemsets Mining Algorithm Based on Combination Approach
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    FP-growth算法用于关联规则挖掘分成两个阶段:构建频繁模式树和进行频繁模式挖掘;对这两个阶段分别进行改进,若项头表中存在同频度的频繁项,在构建FP-tree的过程动态调整其位置,构建压缩的最优化FP-tree,提出了IMFP-tree算法。在进行频繁模式挖掘阶段,提出CFP-mine 算法,CFP-mine算法采用一种新方法构建条件模式基,且采用组合方式挖掘频繁项集,有别于传统FP-growth算法的挖掘过程,理论上证明和实验验证本算法的正确性和高效性。

    Abstract:

    FP-growth algorithm for mining association rules is divided into two phases: building a FP-tree and mining frequent patterns. In this paper new algorithms are proposed to improve the two stages separately. In the first stage, if frequent items in header table have the same support, their position can be dynamically changed to construct a compressed and optimized FP-tree. IMFP-tree algorithm is proposed to realize that function. In the second stage, CFP-mine algorithm is proposed, which constructs pattern-base by using a new method different from the conditional pattern-base in FP-growth.This paper mines frequent itemsets with a new combination method without recursive construction of conditional FP-tree. It has theoretically proved and experimentally verified the correctness and efficiency of CFP-mine algorithm.

    参考文献
    相似文献
    引证文献
引用本文

汪成亮,罗昌银.一种基于组合方式改进的频繁项集挖掘算法.计算机系统应用,2010,19(1):67-71

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2009-04-25
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号