Linux集群监控讨论
有没有人做过linux集群方面的监控,有没有好的方法或专业的集群监控工具。例如:
目前有20台机器安装了linux操作系统,20台机器通过均衡负载策略构成了一个集群,我目前想在压力测试过程中同时监控这20台机器的相关系统性能指标,如:cpu、内存、磁盘I/O等。
有没有方法可以做到,请各位大虾指教! TOPVMSTAT GLANCE nmon这些工具试试看
不过好像只能一台一台的去看监控 即使你用LR 去监控也是一样 关注有什么好方法。。。
回复 2# 的帖子
要是一个人去看20台机器的资源,你肯定要疯掉的,还不如找20个人去看,一对一,比你那方便 帮顶 帮顶 帮顶 帮顶 帮顶 1:监控各个机器得到的负载均衡数;2:在压力测试之前到每个服务器上运行nmon程序,压力测试之后对20个文件进行分析就可以得出20个机器的资源情况。关于nmon的使用论坛上有。
如果是LVS
试试集群监控软件ganglia
http://sourceforge.net/projects/ganglia 您好!问一下,如果使用ganglia集群监控软件
1.是否需要在20台机器分别安装一个相当代理(agent);
或
2.是否需要开启20台机器的相关服务或端口
有详细的使用文档或手册,可以提供一下吗?
回复 12# 的帖子
关于ganglia我没具体用过。关于ganglia的用法,你google试试,应该有配置的步骤,再找不着去它的首页找找。
回复 11# 的帖子
您好!问一下,如果使用ganglia集群监控软件1.是否需要在20台机器分别安装一个相当代理(agent);
或
2.是否需要开启20台机器的相关服务或端口
有详细的使用文档或手册,可以提供一下吗?
回复 13# 的帖子
好的,谢了回复 10# 的帖子
你这方法太费劲了,而且不能在压力测试中实时的观看,只能在压力结束后,对保存在20台机器的资源情况一个一个去分析,很麻烦,也很头痛不过很感谢你这个方法,其实我觉得如果可以用loadrunner自带的liunx监控器去监控16台,然后剩下4台用top看,还比你这方面,至少16台机器可以在压力过程中实时的观察资源情况
关于集群监控的发展方向
我个人觉得,,在一些大型的数据搜索项目例如:TRS全文检索系统
项目中使用了7个TRS,然后用7台agent代理(1个agent代理12台全文索引服务器,7台服务器×12=84台)
对于84台服务器的监控,就有点难度了,值得大家进一步探讨
所以在压力测试过程中,如何做到实时监控或观察上百台服务器的系统资源,这是一个难点,希望有做过这方面的人,有类似问题的人,或想进一步学习提高的人,大家可以互相探讨一下,互相学习了。
回复 17# 的帖子
期待你试用ganglia监控的结果 :) 学习了,还没尝试过。有机会去玩玩
页:
[1]