一种批量抽取动态Web 信息系统
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

宁夏科技攻关计划项目(KGX-01-10-01)


Batch Extraction Information System from Dynamic Web
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    针对从Web 页面获取信息的广泛需求,分析了从中提取信息的关键技术如URL 地址、HTML 页面和HtmlParse 解析库;以从Google Map 中获取企业黄页信息为例,根据从中自动提取数据的技术和步骤,设计和实现了该系统原型,并指出的相关问题及其解决办法。

    Abstract:

    In order to respond some extensive requirements for getting information from Web pages, some key techniques such as URL, HTML page and HtmlParse API, were analyzed. Getting yellow page information from Google maps was taken as an example, and according to related techniques and steps of abstracting information from it, the system prototype was designed and implemented. Some related problems were presented, and its corresponding solution were discussed too.

    参考文献
    相似文献
    引证文献
引用本文

马龙,张春涛,杨德仁.一种批量抽取动态Web 信息系统.计算机系统应用,2011,20(3):41-44

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-07-16
  • 最后修改日期:2010-08-19
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号