本文已被:浏览 1488次 下载 2698次
中文摘要: 随着互联网的发展和普及,Internet上的信息急剧增长,能够自动获取适用,简单和精炼的信息,成为人们的迫切希望。同时针对农村互联网条件差而手机越来越普及的情况,我们设计实现了一个基于WEB信息抽取和GSM的主动服务系统。本文在分析农产品供求信息网页结构的基础上,提出了一种基于内容和web文档结构路径(DOM)相结合的信息抽取算法。最后实验结果说明该抽取算法能够很好地制定抽取规则并能够准确的抽取所需要的内容。
中文关键词: WEB信息抽取 GSM 主动服务 DOM 包装器
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:中国科学院知识创新工程重要方向项目(编号:KGCX2-SW-511)
Author Name | Affiliation |
于静 | 中国科学院合肥智能机械研究所 合肥 230031 |
李淼 | 中国科学院合肥智能机械研究所 合肥 230031 |
Author Name | Affiliation |
于静 | 中国科学院合肥智能机械研究所 合肥 230031 |
李淼 | 中国科学院合肥智能机械研究所 合肥 230031 |
引用文本:
于静,李淼.基于WEB信息抽取的主动服务技术研究.计算机系统应用,2008,17(1):54-56
.Research on initiative service technology based on web information extraction.COMPUTER SYSTEMS APPLICATIONS,2008,17(1):54-56
于静,李淼.基于WEB信息抽取的主动服务技术研究.计算机系统应用,2008,17(1):54-56
.Research on initiative service technology based on web information extraction.COMPUTER SYSTEMS APPLICATIONS,2008,17(1):54-56