51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 5867|回复: 7
打印 上一主题 下一主题

[原创] 持续运行脚本,vmstat监控AIX得到的memory的avm值不断在增大,fre值不断减小?

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2008-3-27 16:45:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
持续运行脚本(一报表查询功能),vmstat监控AIX,发现memory的avm值不断在增大(实际内存2G),fre值不断减小,这正常吗?如果存在问题,针对该情况如何进行判断并定位问题?
以下是监控到的部分值,各项指标除了avm和fre的值,看起来挺正常
kthr    memory              page              faults        cpu   
----- ----------- ------------------------ ------------ -----------
r  b   avm   fre  re  pi  po  fr   sr  cy  in   sy  cs us sy id wa
0  0 435073 42215   0   0   0   0    0   0 497 3294 592 10  4 86  0
1  0 435094 42194   0   0   0   0    0   0   7 1030 185  0  0 99  0
0  0 435094 42194   0   0   0   0    0   0 101 1547 317  0  1 98  0
2  0 435125 42163   0   0   0   0    0   0  62 2060 279  0  1 98  0

应用服务器AIX+Apache+websphere,数据库服务器win2ksrv+oracle9.2(配置一般),持续运行时,数据库服务器的CPU占用率一直处于100%,可用内存较为正常。
有客户反应用服务器的websphere出现内存溢出现象,导致须要重启机器。测试环境下并未发现应用服务器websphere内存溢出,但数据库服务器出现性能过低,由于测试环境的数据库服务器配置较差,使得测试环境下瓶颈出现在了数据库服务器,导致应用服务器并未真正实现压力?

[ 本帖最后由 newtester2008 于 2008-3-27 21:25 编辑 ]
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

该用户从未签到

2#
 楼主| 发表于 2008-3-27 16:59:43 | 只看该作者
是否需要结合Websphere自带的Tivoli Performance Viewer进行监控
回复 支持 反对

使用道具 举报

该用户从未签到

3#
 楼主| 发表于 2008-3-27 21:29:32 | 只看该作者
打开TPV运行后,fre值基本平稳在10000上下,而avm值却还是一直在增加,并且page的pi、po、fr等值开始不为0了,pi的值有时超过10,但并非持续超过10,按有些说明pi值超过5并存在一些内存不足?
回复 支持 反对

使用道具 举报

该用户从未签到

4#
发表于 2008-3-27 22:41:04 | 只看该作者
看起来 sr 这些都是 0 阿

内存貌似足够的
回复 支持 反对

使用道具 举报

该用户从未签到

5#
 楼主| 发表于 2008-3-28 09:43:30 | 只看该作者
原帖由 liangjz 于 2008-3-27 22:41 发表
看起来 sr 这些都是 0 阿

内存貌似足够的


那是未打开TPV之前的监测数据,打开TPV后,avm值超过了实际内存,page的各项值出现了大于0
回复 支持 反对

使用道具 举报

该用户从未签到

6#
 楼主| 发表于 2008-3-28 09:49:26 | 只看该作者
原帖由 szyszy2000 于 2008-3-28 01:01 发表
先详细考察客户的问题
尽量重现问题,测试环境的测试数据是否足够?
客户为什么会认为是内存溢出。
可以先验证下,打开WebSphere的JVM详细跟踪的属性。
检查gc时间与正常时间的比值是否小于1/10。

另外数据库服务器CPU100%并不属于 正常现象。


客户数据和测试环境的数据是差不多的
gc时间在哪里可以查看,TPV中似乎没有这指标的查看,有JVM Runtime的Total Memory/Free Memory/Used Memory值,另外正常时间指的是什么?

关于数据库服务器的CPU100%使用,我想在数据库服务器这么低的内存下,并发多个用户应该是比较正常的吧
回复 支持 反对

使用道具 举报

该用户从未签到

7#
 楼主| 发表于 2008-3-31 18:04:24 | 只看该作者
该功能20个用户并发没有错误信息,结果只是响应时间较慢而已(120秒左右),而50个用户并发时,出现以下提示,基本要超时(设置900秒超时),差不多运行12分钟后,强行停止了vuser运行。
Monitor name :Windows Resources. 计算机 192.168.0.119 (上述数据库服务器)似乎已重新启动,且现在已经联机。
注意,刷新为此计算机选择的所有度量可能会需要一段时间。
提示:
如果未收到度量数据,请检查计算机连接(入口点: Measurement::getNewData)        [MsgId: MMSG-47287]

终止运行后发现数据库服务器运行特别慢,基本无法再操作,而CPU使用率和可用内存看起来挺正常(可用内存150M左右,内存使用1.2G/2.8G,2.1G虚拟内存)
该数据库服务器部署了Tomcat,运行系统管理,报表查询的应用有独立的应用服务(即上述应用服务器),但用户登录信息等还是要依赖于系统管理,controller终止后,Tomcat并没有发现50个用户的退出提示(正常情况都能记录用户登录、操作、退出等简单信息)。并且该现象发生后,应用服务器的Websphere也变得非常慢,基本需要重新启动,而应用服务器的内存、CPU以及Webshere的gc、JVM并没有发现有什么异常。

我本希望部署在Tomcat的应用移到应用服务器,部署在Websphere下,但开发说Tomcat并没有什么影响。

如何来诊断其中的问题?数据库连接未释放?应用程序未释放?有点晕

[ 本帖最后由 newtester2008 于 2008-3-31 21:54 编辑 ]
回复 支持 反对

使用道具 举报

该用户从未签到

8#
发表于 2009-3-3 10:18:07 | 只看该作者

即稳定又快才是好的服务器

处理内存泄露问题可以使用UFO,UFO不会出现一个字节的内存泄漏;UFO是世界上最稳定最快的支持Jsp的Web Server,用UFO做Web Server,网站可以做到一万年也不down,对于Jsp程序的各种问题,UFO的作者也会免费帮您解决。下载网址:www.gm365.com
回复 支持 反对

使用道具 举报

本版积分规则

关闭

站长推荐上一条 /1 下一条

小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

GMT+8, 2024-9-24 00:27 , Processed in 0.084126 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2024 Comsenz Inc.

快速回复 返回顶部 返回列表