基于PowerBuilder的网页数据抓取
作者:
基金项目:

衡水学院青年专项课题基金项目(2008057)


Web Data Extraction Based on PowerBuilder
  • 摘要
  • | |
  • 访问统计
  • |
  • 参考文献 [1]
  • |
  • 相似文献 [20]
  • |
  • 引证文献
  • | |
  • 文章评论
    摘要:

    互联网飞速发展,WEB已经成为一个巨大的信息资源库,各行各业的信息均可以在互联网上找到。及时准确的获得、存贮、分析、利用这些信息是非常重要的。利用PowerBuilder和MicroSoft SQL Server数据库,提出了一种对网页的数据抓取的方法。用户首先选定样本页面,其次在样本中预先定义抓取模式,然后对样本网页和其中的样本进行标记,形成信息的抓取规则,进行数据抓取,并存入数据库。最后利用数据库对信息进行分类,抽取出所需的信息,达到分析准确、抓取速度快的目的。

    Abstract:

    衡水学院青年专项课题基金项目(2008057)

    参考文献
    1 罗敖生.基于ASP实现网上数据的自动抓取.江苏广播电视大学学报, 2004,6:60-61. 2 张勇毅,姚华.PowerBuilder+SQL Server数据库应用系统开发与实例.北京:人民邮电出版社, 2007: 260- 275. 3 余金山,冯星红,李肖.PowerBuilder 10参考手册.北京:科学出版社, 2005:180-196. 4 张惠颖,曲著伟.基于子树匹配的交互式WEB数据抽取方法.计算机工程, 2006,9:78-80. 5 李玉波.韩光林.SQL Server完全自学手册.北京:机械工业出版社, 2007 :168-190.
    网友评论
    网友评论
    分享到微博
    发 布
引用本文

刘书华,陈国奎.基于PowerBuilder的网页数据抓取.计算机系统应用,2009,18(2):171-175

复制
分享
文章指标
  • 点击次数:2423
  • 下载次数: 4408
  • HTML阅读次数: 0
  • 引用次数: 0
历史
文章二维码
您是第12693620位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号