摘要:随着云计算技术的日益发展, Linux集群以造价低廉、易于扩充等优势得到了愈来愈广泛的应用. 为了更好地发挥集群性能, 充分利用集群节点的资源, 对集群性能进行实时监控是很有必要的. 提出了一种Linux集群监控器设计与实现方法. 该方法通过每隔一段时间采集节点机/proc虚拟文件系统中的信息, 如CPU和内存使用情况等. 经过过滤后, 通过socket传输给监控服务器. 论文首先给出了监控器的总体设计方案, 整个监控系统由守护在管理节点上的信息管理服务器进程和运行在各个计算节点上的采集器进程组成. 然后分采集器和信息管理器两大部分, 分别介绍了其具体的设计框架和其采用的关键技术. 采集器分主要由信息采集、信息处理和信息传送3 个模块组成, 分别采用3 个线程来完成. 信息管理器采用了线程池技术, 用以接受采集器发送过来的传输请求. 实践证明, 该系统可以很好地满足实时监控Linux 集群性能的需要.