本文已被:浏览 1590次 下载 4483次
Received:March 25, 2009
Received:March 25, 2009
中文摘要: 当前基于网页的抓取技术只是简单地获取整个页面的HTML文件并抽取所需的文本信息,而对于其它MIME对象,如图片,特别是通过ASP、JSP或Servlet等服务器端组件查询后返回的图片对象,则很难获取。为了解决这个问题,提出了一种基于Internet Explorer缓存的Web图片获取方法:在Visual C++中采用多线程技术构造一个浏览器对象,将选定的样本图片页面在浏览器对象中打开,然后在IE缓存中搜索并获取所需的Web图片,最后将它存入Oracle数据库中分析使用。这种方法的优点是能够方便、快捷的获
中文关键词: IE缓存 图片获取 多线程 线程同步 事件
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
欧永红 | 华南理工大学 计算机科学与工程学院 广东 广州 510006 |
姚耀文 |
Author Name | Affiliation |
欧永红 | 华南理工大学 计算机科学与工程学院 广东 广州 510006 |
姚耀文 |
引用文本:
欧永红,姚耀文.一种基于IE缓存的Web图片获取方法.计算机系统应用,2009,18(12):208-211
.An Approach for Grabbing Image from Web Based on IE Cache.COMPUTER SYSTEMS APPLICATIONS,2009,18(12):208-211
欧永红,姚耀文.一种基于IE缓存的Web图片获取方法.计算机系统应用,2009,18(12):208-211
.An Approach for Grabbing Image from Web Based on IE Cache.COMPUTER SYSTEMS APPLICATIONS,2009,18(12):208-211