人数增加,吞吐量不变、每秒点击量不变、TPS下降,可否定义为网络瓶颈
客户要求对portal进行400人压力测试,响应时间一直达不到要求。以做过很多方面的优化,weblogic的参数调整、代码的优化、增加了缓存,但是还是达不到理想的结果。为了寻找原因做了50人~800人的递增测试,每5分钟增加50人。一台主测试机+7台负载机,中途一台负载机掉线,还有部分用户failed,因此最后结束时用户不到700人。页面为1.5MB,应用服务器、数据库服务器的CPU和内存均没有问题,感觉是网络的瓶颈。8台测试机均是百兆带宽,路由标也是百兆,以前试过一个千兆的路由但是效果不明显,不知道还有没有其他办法可以找出问题???
客户网站的注册人数为2万,客户要求400人5秒响应,但是目前来看这个时间是不可能达到的,个人觉得也不太合理,大家有没有一个标准的数据可供参考,一个网站做到什么程度算是合格。。。
测试结果:
每秒点击量与人数关系
吞吐量与人数关系
TPS与人数关系
响应时间与人数关系
由于领导和客户把问题归结于产品问题,决定替换调用方法,所以这次测试被太监了,也不能验证问题所在,太可惜了。。。。
[ 本帖最后由 z3z3z3z3 于 2010-9-17 16:56 编辑 ] 是否网络瓶颈,这个很好判断吧,只需要分析网络状况就OK了 从上面这些图看不出来是否是网络瓶颈 receivetime很长,但是firstbuffr中的network很正常
[ 本帖最后由 z3z3z3z3 于 2010-7-20 14:13 编辑 ] 你都添加了哪些计数器?吞吐量的图呢? "receivetime很长 " 看是那个请求页面造成很长的 。。。。
第二个就是吞吐量的图 网络瓶颈是可能的,吞吐率过早达到峰值,测一下单个用户单次访问会产生多大的流量。
20000注册用户,那期望同时在线多少?业务高峰发生在什么样的时间区域内?个人认为性能测试属于行为模拟学,你对业务场景不熟悉,测试出来的数据不具备说服力。
TPS这个指标,如果不是类似银行、电信这样的TPS敏感行业,不用过多关注,响应时间最直观。 从你的图来分析我个人觉的这里面肯定有问题,上面的图是我做的一个web网站的性能测试(多次结果中的一个)
[ 本帖最后由 cen0225 于 2010-7-20 14:21 编辑 ] 原帖由 tttrrryyy 于 2010-7-20 14:10 发表 http://bbs.51testing.com/images/common/back.gif
网络瓶颈是可能的,吞吐率过早达到峰值,测一下单个用户单次访问会产生多大的流量。
20000注册用户,那期望同时在线多少?业务高峰发生在什么样的时间区域内?个人认为性能测试属于行为模拟学,你对业务场景不熟悉, ...
客户只给了2万注册用户、假设业务高峰在早上上班的15分钟内,也不知道400人5秒是怎么定出来的,一切都要我们来评估。。。感觉对这个项目很无语,本身产品就有缺陷。。。
回复 9# 的帖子
感谢9楼给出的参考又做了次1人~8人的,吞吐量、每秒点击量、TPS都成明显的上升趋势
[ 本帖最后由 z3z3z3z3 于 2010-7-20 14:33 编辑 ] 会不会是你的自己压力机出现的问题。看了你的网页分析图接受的时间都是很长,会不会是你的压力机压力太大了有时候也要考虑硬件问题。只是猜测 如果是网络瓶颈的话,一般会有sever shutdown或time out的报错
我以前也有测过处理速度越来越慢的情况,是存储过程临时表设置错误,导致缓存操作超时,最后内存溢出。
你可以设置前端并发数大些,LR运行时间长些,看会不会报错超出内存。 我只注意过50、100的时候,8台机的网络占用率、CPU不大都在20%上下,50和100的吞吐就已经没有变化 有出现timeout,大概在10%左右 应用服务器上看看运行时候,端口的链接数或java句柄数,会不会释放或增加
如果不变说明程序有问题 8台机器都是测试机,你怎么不看服务器端的带宽占多少了 我怎么看服务器端的带宽?
按照公式:1.5M*8*400/5=960M/s,服务器千兆带宽应该够吧
回复 1# 的帖子
你们的指标有哪些,目标是多少才达到要求,你只贴这些图的目的是什么,你怎么说不符合呢?你运行有报错了吗? 1.客户期望达到400人5秒响应2.期望能找到瓶颈,进行优化。
3.运行有timeout,压400人时有10%。50~700人递增时有30%
[ 本帖最后由 z3z3z3z3 于 2010-7-20 15:55 编辑 ]