本文已被:浏览 2263次 下载 4137次
中文摘要: 互联网飞速发展,WEB已经成为一个巨大的信息资源库,各行各业的信息均可以在互联网上找到。及时准确的获得、存贮、分析、利用这些信息是非常重要的。利用PowerBuilder和MicroSoft SQL Server数据库,提出了一种对网页的数据抓取的方法。用户首先选定样本页面,其次在样本中预先定义抓取模式,然后对样本网页和其中的样本进行标记,形成信息的抓取规则,进行数据抓取,并存入数据库。最后利用数据库对信息进行分类,抽取出所需的信息,达到分析准确、抓取速度快的目的。
中文关键词: HTML 模式 数据抓取 抓取器 数据挖掘
Abstract:衡水学院青年专项课题基金项目(2008057)
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:衡水学院青年专项课题基金项目(2008057)
Author Name | Affiliation |
刘书华 | 衡水学院 数学与计算机科学系 河北 衡水 053000 |
陈国奎 | 衡水学院 数学与计算机科学系 河北 衡水 053000 |
Author Name | Affiliation |
刘书华 | 衡水学院 数学与计算机科学系 河北 衡水 053000 |
陈国奎 | 衡水学院 数学与计算机科学系 河北 衡水 053000 |
引用文本:
刘书华,陈国奎.基于PowerBuilder的网页数据抓取.计算机系统应用,2009,18(2):171-175
.Web Data Extraction Based on PowerBuilder.COMPUTER SYSTEMS APPLICATIONS,2009,18(2):171-175
刘书华,陈国奎.基于PowerBuilder的网页数据抓取.计算机系统应用,2009,18(2):171-175
.Web Data Extraction Based on PowerBuilder.COMPUTER SYSTEMS APPLICATIONS,2009,18(2):171-175