基于属性重要性的WUM数据预处理方式
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

安徽科技学院青年基金(ZIC2011117);安徽科技学院教研课题(X201014)


Data Preprocessing Method Based on Importance of Property for WUM
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为了降低Web 日志数据的规模,并能从预处理后的数据中发现更有价值的访问模式,在引入知识的信息量的基础上,给出了单个属性相对于属性集的重要性量化值的概念,并采用了操作系统中LRU 页面置换算法的思想,提出了基于属性重要性的WUM 数据预处理方式。实验证明:该方式可以删除不具有挖掘价值的、因用户短期行为而访问的Web 日志记录,剔除掉噪音数据,从而有效减小了日志挖掘的复杂度。

    Abstract:

    To reduce the Web log data scale and discover more recommendable access patterns from data preprocessed, with knowledge based on amount of information, the concept of quantify value of importance of every property in relation to property set was proposed, and used the idea of LRU page replacement algorithm in the operating system, a new data preprocessing method based on importance of property was proposed. The experiments show that the method could delete Web log records which were caused by user short-behavior and have not mining value, and filter out the noise data. Accordingly it can reduce the complexity of log mining effectively.

    参考文献
    相似文献
    引证文献
引用本文

王亚军,王传安.基于属性重要性的WUM数据预处理方式.计算机系统应用,2011,20(5):219-222,247

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-09-09
  • 最后修改日期:2010-12-30
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号