本文已被:浏览 1603次 下载 2965次
Received:September 24, 2008
Received:September 24, 2008
中文摘要: WWW 上用户的访问路径信息会被记录在WEB 服务器的日志记录中,分析这些日志并挖掘出用户的主要行为模式,可以提取出WEB 网站被频繁访问的主干部分。本文首先将原始日志信息整理成目标页前向访问路径集TUPD(Target Pages User Forward Access Path Dataset),然后在TUPD 上生成加权网站结构多维树WWSSMT(Weighted Web Site Structure Multi-Tree),最后引入决策频度阀值S,删除所有WWSSMT 中weight
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:国家973 计划项目(2005CB321904)
Author Name | Affiliation |
鲍 钰 | 华东师范大学 软件学院 上海 200062 |
Author Name | Affiliation |
鲍 钰 | 华东师范大学 软件学院 上海 200062 |
引用文本:
鲍 钰.基于网站日志挖掘的频繁遍历主干子网发现.计算机系统应用,2009,18(4):22-25
.Mining Web Logs to Discover Major Web Site Structure.COMPUTER SYSTEMS APPLICATIONS,2009,18(4):22-25
鲍 钰.基于网站日志挖掘的频繁遍历主干子网发现.计算机系统应用,2009,18(4):22-25
.Mining Web Logs to Discover Major Web Site Structure.COMPUTER SYSTEMS APPLICATIONS,2009,18(4):22-25