本文已被:浏览 1747次 下载 3638次
Received:March 31, 2010 Revised:May 11, 2010
Received:March 31, 2010 Revised:May 11, 2010
中文摘要: 根据网络信息量大的特点,以及主题网络爬虫效率上的要求,将postgresql数据库集群技术运用在主题网络爬虫当中,解决了爬虫对大信息量的存储,并采用缓存技术解决了集群技术在爬虫应用中的效率瓶颈。
Abstract:In respect to the characteristics of hugeness of net information and request for spider efficiency in topic net, this paper applies postgresql database cluster to the topic net spider, meets the need for huge storage space by spider, and also tackled the bottleneck of efficiency with cache technology when the cluster technology is applied in spider..
keywords: spider search engine database postgresql cluster
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
刘淑梅 | 北京化工大学 信息研究院 北京 100029 |
夏亮 | |
许南山 |
Author Name | Affiliation |
刘淑梅 | 北京化工大学 信息研究院 北京 100029 |
夏亮 | |
许南山 |
引用文本:
刘淑梅,夏亮,许南山.Postgresql数据库集群在主题网络爬虫的应用.计算机系统应用,2010,19(12):160-163
.Topic Spider with Postgresql Datebase Cluster.COMPUTER SYSTEMS APPLICATIONS,2010,19(12):160-163
刘淑梅,夏亮,许南山.Postgresql数据库集群在主题网络爬虫的应用.计算机系统应用,2010,19(12):160-163
.Topic Spider with Postgresql Datebase Cluster.COMPUTER SYSTEMS APPLICATIONS,2010,19(12):160-163