###
DOI:
计算机系统应用英文版:2010,19(12):160-163
本文二维码信息
码上扫一扫!
Postgresql数据库集群在主题网络爬虫的应用
(北京化工大学 信息研究院 北京 100029)
Topic Spider with Postgresql Datebase Cluster
摘要
图/表
参考文献
相似文献
本文已被:浏览 1747次   下载 3638
Received:March 31, 2010    Revised:May 11, 2010
中文摘要: 根据网络信息量大的特点,以及主题网络爬虫效率上的要求,将postgresql数据库集群技术运用在主题网络爬虫当中,解决了爬虫对大信息量的存储,并采用缓存技术解决了集群技术在爬虫应用中的效率瓶颈。
中文关键词: 网络爬虫  搜索引擎  主题相关  遗传  抓取
Abstract:In respect to the characteristics of hugeness of net information and request for spider efficiency in topic net, this paper applies postgresql database cluster to the topic net spider, meets the need for huge storage space by spider, and also tackled the bottleneck of efficiency with cache technology when the cluster technology is applied in spider..
文章编号:     中图分类号:    文献标志码:
基金项目:
引用文本:
刘淑梅,夏亮,许南山.Postgresql数据库集群在主题网络爬虫的应用.计算机系统应用,2010,19(12):160-163
.Topic Spider with Postgresql Datebase Cluster.COMPUTER SYSTEMS APPLICATIONS,2010,19(12):160-163