Jerry_zhiyuan 发表于 2010-4-25 11:07:10

服务器过多如何监控性能

现在要做一个系统的性能测试,服务器组有23台服务器,包括数据库、应用服务器、wap服务器,有些是设置了负载均衡的
这么多的服务器,怎么监控啊
通过lr本身自带的监控,感觉不实际,而且很容易出现rpc问题
如果通过每个服务器的命令监控,比较麻烦
而且场景比较多,如果这样的话,操作起来很麻烦
各位,有没有什么好的建议啊

Jerry_zhiyuan 发表于 2010-4-25 11:07:33

先自己顶一下,周日,估计人少咯:lol

Jerry_zhiyuan 发表于 2010-4-25 14:46:38

怎么没人回复咯:(
急着解决呢,现在准备用ss9.5,不过也是麻烦的事

liangshi 发表于 2010-4-25 18:02:48

请问是Linux服务器还是Windows服务器?
微软推出了System Center Operation Manager (SCOM)可以完美的解决服务器(支持Linux和Windows)性能监控问题,但是价格不菲。
另一种途径是利用Windows自带的perfmon来监控。或者,自Windows 2008之后的操作系统,有一个命令typeperf。它的帮助如下。从帮助可以看出,它支持收集其他机器上的performance counter,而且机器名、counter名可以从配置文件中读取。你可以预先写好几个配置文件,不同的测试让typeperf加载不同的配置文件,这样就可以监控不同的机器和counter。typeperf的输出可以是csv格式的文本文件,适合进一步分析。

Usage:
typeperf { <counter > | -cf <filename> | -q | -qx }

Parameters:
<counter >       Performance counters to monitor.

Options:
-?                            Displays context sensitive help.
-f <CSV|TSV|BIN|SQL>          Output file format. Default is CSV.
-cf <filename>                File containing performance counters to monitor, one per line.
-si <[mm:]ss>            Time between samples. Default is 1 second.
-o <filename>               Path of output file or SQL database. Default is STDOUT.
-q                    List installed counters (no instances). To list counters for one
                              object, include the object name, such as Processor.
-qx                   List installed counters with instances. To list counters for one
                              object, include the object name, such as Processor.
-sc <samples>               Number of samples to collect. Default is to sample until CTRL+C.
-config <filename>            Settings file containing command options.
-s <computer_name>            Server to monitor if no server is specified in the counter path.
-y                            Answer yes to all questions without prompting.

Note:
Counter is the full name of a performance counter in
"\\<Computer>\<Object>(<Instance>)\<Counter>" format,
such as "\\Server1\Processor(0)\% User Time".

Examples:
typeperf "\Processor(_Total)\% Processor Time"
typeperf -cf counters.txt -si 5 -sc 50 -f TSV -o domain2.tsv
typeperf -qx PhysicalDisk -o counters.txt

msnshow 发表于 2010-4-25 19:07:53

用开源的监控工具吧,如cacti nagios之类的

森林一木 发表于 2010-4-26 10:06:27

试试application manage

Jerry_zhiyuan 发表于 2010-4-26 10:11:34

系统都是linux服务器,也有unix的
看看4、5、6楼的提供的方法看看,是否可行,实在不行,就只能一个个来了,就是麻烦了很多
谢谢各位啦:handshake :kiss:

PrefTest 发表于 2010-4-26 10:48:05

开源的Hyperic HQ

ziheng198688 发表于 2010-4-27 16:48:25

我感觉只要你正确配置了rstatd daemon,然后使用LR去监控应该不会有问题的啊,这个应该也是比较准确的方法。使用其他方法的话,你还得根据运行时间去过滤那些得到的数据,有的还得使用其他工具生成相应的图表。
页: [1]
查看完整版本: 服务器过多如何监控性能