一种基于序列数的Web使用挖掘算法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

重庆庆教委科技项目(KJ091108)


Web Usage Mining Algorithm Based on Sequence Number
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对Web服务器日志中会话模式的页面属性为布尔量的特点,提出一种基于序列数的Web使用挖掘算法。该算法将用户会话模式转换成二进制数,然后用数字递增方式搜索候选频繁项;算法通过序列数的维来计算支持数,实现一次扫描用户会话模式,有效地提高了Web使用挖掘的效率。实验表明其效率比现有算法更快速而有效。

    Abstract:

    Aiming to the character that page attribute of session pattern in Web server log is Boolean quantity, an algorithm of Web usage mining based on sequence number is presented. The algorithm turns session pattern of users into binary, and then uses the way of number ascending to search candidate frequent itemsets. The algorithm computes support by sequence number dimension in order to scan once session pattern of users, and then the efficiency of Web usage mining is efficient improved. The experiment indicates that the efficiency is faster and more efficient than presented algorithms.

    参考文献
    相似文献
    引证文献
引用本文

方刚.一种基于序列数的Web使用挖掘算法.计算机系统应用,2010,19(12):100-104

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-04-10
  • 最后修改日期:2010-05-22
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号