中国科学院知识创新工程重要方向项目(编号:KGCX2-SW-511)
随着互联网的发展和普及,Internet上的信息急剧增长,能够自动获取适用,简单和精炼的信息,成为人们的迫切希望。同时针对农村互联网条件差而手机越来越普及的情况,我们设计实现了一个基于WEB信息抽取和GSM的主动服务系统。本文在分析农产品供求信息网页结构的基础上,提出了一种基于内容和web文档结构路径(DOM)相结合的信息抽取算法。最后实验结果说明该抽取算法能够很好地制定抽取规则并能够准确的抽取所需要的内容。
于静,李淼.基于WEB信息抽取的主动服务技术研究.计算机系统应用,2008,17(1):54-56
京公网安备 11040202500063号