tengfei 发表于 2009-5-11 10:23:35

Linux集群监控讨论

有没有人做过linux集群方面的监控,有没有好的方法或专业的集群监控工具。

例如:
目前有20台机器安装了linux操作系统,20台机器通过均衡负载策略构成了一个集群,我目前想在压力测试过程中同时监控这20台机器的相关系统性能指标,如:cpu、内存、磁盘I/O等。


有没有方法可以做到,请各位大虾指教!

泊涯 发表于 2009-5-11 10:32:48

TOPVMSTAT GLANCE nmon这些工具试试看
不过好像只能一台一台的去看监控 即使你用LR 去监控也是一样

fairylly 发表于 2009-5-11 15:10:03

关注有什么好方法。。。

tengfei 发表于 2009-5-12 11:28:56

回复 2# 的帖子

要是一个人去看20台机器的资源,你肯定要疯掉的,还不如找20个人去看,一对一,比你那方便

cloud_chen 发表于 2009-5-12 11:38:11

帮顶

cloud_chen 发表于 2009-5-12 12:05:17

帮顶

cloud_chen 发表于 2009-5-12 12:07:06

帮顶

cloud_chen 发表于 2009-5-12 12:12:10

帮顶

cloud_chen 发表于 2009-5-12 12:12:42

帮顶

cafard-haibin 发表于 2009-5-13 10:29:54

1:监控各个机器得到的负载均衡数;
2:在压力测试之前到每个服务器上运行nmon程序,压力测试之后对20个文件进行分析就可以得出20个机器的资源情况。关于nmon的使用论坛上有。

shanxi 发表于 2009-5-13 10:50:02

如果是LVS

试试
集群监控软件ganglia
http://sourceforge.net/projects/ganglia

tengfei 发表于 2009-5-13 11:12:11

您好!问一下,如果使用ganglia集群监控软件
1.是否需要在20台机器分别安装一个相当代理(agent);

2.是否需要开启20台机器的相关服务或端口

有详细的使用文档或手册,可以提供一下吗?

shanxi 发表于 2009-5-13 11:15:45

回复 12# 的帖子

关于ganglia我没具体用过。
关于ganglia的用法,你google试试,应该有配置的步骤,再找不着去它的首页找找。

tengfei 发表于 2009-5-13 11:18:25

回复 11# 的帖子

您好!问一下,如果使用ganglia集群监控软件
1.是否需要在20台机器分别安装一个相当代理(agent);

2.是否需要开启20台机器的相关服务或端口

有详细的使用文档或手册,可以提供一下吗?

tengfei 发表于 2009-5-13 11:19:40

回复 13# 的帖子

好的,谢了

tengfei 发表于 2009-5-13 11:23:42

回复 10# 的帖子

你这方法太费劲了,而且不能在压力测试中实时的观看,只能在压力结束后,对保存在20台机器的资源情况一个一个去分析,很麻烦,也很头痛
不过很感谢你这个方法,其实我觉得如果可以用loadrunner自带的liunx监控器去监控16台,然后剩下4台用top看,还比你这方面,至少16台机器可以在压力过程中实时的观察资源情况

tengfei 发表于 2009-5-13 11:34:57

关于集群监控的发展方向

我个人觉得,,在一些大型的数据搜索项目
例如:TRS全文检索系统
项目中使用了7个TRS,然后用7台agent代理(1个agent代理12台全文索引服务器,7台服务器×12=84台)
对于84台服务器的监控,就有点难度了,值得大家进一步探讨
所以在压力测试过程中,如何做到实时监控或观察上百台服务器的系统资源,这是一个难点,希望有做过这方面的人,有类似问题的人,或想进一步学习提高的人,大家可以互相探讨一下,互相学习了。

shanxi 发表于 2009-5-13 12:35:20

回复 17# 的帖子

期待你试用ganglia监控的结果 :)

yetties2005 发表于 2009-5-13 12:42:48

学习了,还没尝试过。有机会去玩玩
页: [1]
查看完整版本: Linux集群监控讨论