newtester2008 发表于 2008-3-27 16:45:01

持续运行脚本,vmstat监控AIX得到的memory的avm值不断在增大,fre值不断减小?

持续运行脚本(一报表查询功能),vmstat监控AIX,发现memory的avm值不断在增大(实际内存2G),fre值不断减小,这正常吗?如果存在问题,针对该情况如何进行判断并定位问题?
以下是监控到的部分值,各项指标除了avm和fre的值,看起来挺正常
kthr    memory            page            faults      cpu   
----- ----------- ------------------------ ------------ -----------
rb   avm   frerepipofr   srcyin   sycs us sy id wa
00 435073 42215   0   0   0   0    0   0 497 3294 592 104 860
10 435094 42194   0   0   0   0    0   0   7 1030 18500 990
00 435094 42194   0   0   0   0    0   0 101 1547 31701 980
20 435125 42163   0   0   0   0    0   062 2060 27901 980

应用服务器AIX+Apache+websphere,数据库服务器win2ksrv+oracle9.2(配置一般),持续运行时,数据库服务器的CPU占用率一直处于100%,可用内存较为正常。
有客户反应用服务器的websphere出现内存溢出现象,导致须要重启机器。测试环境下并未发现应用服务器websphere内存溢出,但数据库服务器出现性能过低,由于测试环境的数据库服务器配置较差,使得测试环境下瓶颈出现在了数据库服务器,导致应用服务器并未真正实现压力?

[ 本帖最后由 newtester2008 于 2008-3-27 21:25 编辑 ]

newtester2008 发表于 2008-3-27 16:59:43

是否需要结合Websphere自带的Tivoli Performance Viewer进行监控

newtester2008 发表于 2008-3-27 21:29:32

打开TPV运行后,fre值基本平稳在10000上下,而avm值却还是一直在增加,并且page的pi、po、fr等值开始不为0了,pi的值有时超过10,但并非持续超过10,按有些说明pi值超过5并存在一些内存不足?

liangjz 发表于 2008-3-27 22:41:04

看起来 sr 这些都是 0 阿

内存貌似足够的

newtester2008 发表于 2008-3-28 09:43:30

原帖由 liangjz 于 2008-3-27 22:41 发表 http://bbs.51testing.com/images/common/back.gif
看起来 sr 这些都是 0 阿

内存貌似足够的

那是未打开TPV之前的监测数据,打开TPV后,avm值超过了实际内存,page的各项值出现了大于0

newtester2008 发表于 2008-3-28 09:49:26

原帖由 szyszy2000 于 2008-3-28 01:01 发表 http://bbs.51testing.com/images/common/back.gif
先详细考察客户的问题
尽量重现问题,测试环境的测试数据是否足够?
客户为什么会认为是内存溢出。
可以先验证下,打开WebSphere的JVM详细跟踪的属性。
检查gc时间与正常时间的比值是否小于1/10。

另外数据库服务器CPU100%并不属于 正常现象。

客户数据和测试环境的数据是差不多的
gc时间在哪里可以查看,TPV中似乎没有这指标的查看,有JVM Runtime的Total Memory/Free Memory/Used Memory值,另外正常时间指的是什么?

关于数据库服务器的CPU100%使用,我想在数据库服务器这么低的内存下,并发多个用户应该是比较正常的吧

newtester2008 发表于 2008-3-31 18:04:24

该功能20个用户并发没有错误信息,结果只是响应时间较慢而已(120秒左右),而50个用户并发时,出现以下提示,基本要超时(设置900秒超时),差不多运行12分钟后,强行停止了vuser运行。
Monitor name :Windows Resources. 计算机 192.168.0.119 (上述数据库服务器)似乎已重新启动,且现在已经联机。
注意,刷新为此计算机选择的所有度量可能会需要一段时间。
提示:
如果未收到度量数据,请检查计算机连接(入口点: Measurement::getNewData)      

终止运行后发现数据库服务器运行特别慢,基本无法再操作,而CPU使用率和可用内存看起来挺正常(可用内存150M左右,内存使用1.2G/2.8G,2.1G虚拟内存)
该数据库服务器部署了Tomcat,运行系统管理,报表查询的应用有独立的应用服务(即上述应用服务器),但用户登录信息等还是要依赖于系统管理,controller终止后,Tomcat并没有发现50个用户的退出提示(正常情况都能记录用户登录、操作、退出等简单信息)。并且该现象发生后,应用服务器的Websphere也变得非常慢,基本需要重新启动,而应用服务器的内存、CPU以及Webshere的gc、JVM并没有发现有什么异常。

我本希望部署在Tomcat的应用移到应用服务器,部署在Websphere下,但开发说Tomcat并没有什么影响。

如何来诊断其中的问题?数据库连接未释放?应用程序未释放?有点晕

[ 本帖最后由 newtester2008 于 2008-3-31 21:54 编辑 ]

HB07140030 发表于 2009-3-3 10:18:07

即稳定又快才是好的服务器

处理内存泄露问题可以使用UFO,UFO不会出现一个字节的内存泄漏;UFO是世界上最稳定最快的支持Jsp的Web Server,用UFO做Web Server,网站可以做到一万年也不down,对于Jsp程序的各种问题,UFO的作者也会免费帮您解决。下载网址:www.gm365.com
页: [1]
查看完整版本: 持续运行脚本,vmstat监控AIX得到的memory的avm值不断在增大,fre值不断减小?