z3z3z3z3 发表于 2010-7-20 13:23:34

人数增加,吞吐量不变、每秒点击量不变、TPS下降,可否定义为网络瓶颈

客户要求对portal进行400人压力测试,响应时间一直达不到要求。以做过很多方面的优化,weblogic的参数调整、代码的优化、增加了缓存,但是还是达不到理想的结果。
       为了寻找原因做了50人~800人的递增测试,每5分钟增加50人。一台主测试机+7台负载机,中途一台负载机掉线,还有部分用户failed,因此最后结束时用户不到700人。页面为1.5MB,应用服务器、数据库服务器的CPU和内存均没有问题,感觉是网络的瓶颈。8台测试机均是百兆带宽,路由标也是百兆,以前试过一个千兆的路由但是效果不明显,不知道还有没有其他办法可以找出问题???
      客户网站的注册人数为2万,客户要求400人5秒响应,但是目前来看这个时间是不可能达到的,个人觉得也不太合理,大家有没有一个标准的数据可供参考,一个网站做到什么程度算是合格。。。
测试结果:
每秒点击量与人数关系


吞吐量与人数关系


TPS与人数关系


响应时间与人数关系






由于领导和客户把问题归结于产品问题,决定替换调用方法,所以这次测试被太监了,也不能验证问题所在,太可惜了。。。。

[ 本帖最后由 z3z3z3z3 于 2010-9-17 16:56 编辑 ]

msnshow 发表于 2010-7-20 13:37:40

是否网络瓶颈,这个很好判断吧,只需要分析网络状况就OK了

msnshow 发表于 2010-7-20 13:37:58

从上面这些图看不出来是否是网络瓶颈

z3z3z3z3 发表于 2010-7-20 13:40:07

receivetime很长,但是firstbuffr中的network很正常








[ 本帖最后由 z3z3z3z3 于 2010-7-20 14:13 编辑 ]

cen0225 发表于 2010-7-20 14:04:42

你都添加了哪些计数器?吞吐量的图呢?

Ж神Ж 发表于 2010-7-20 14:05:46

"receivetime很长 " 看是那个请求页面造成很长的

z3z3z3z3 发表于 2010-7-20 14:07:28

。。。。
第二个就是吞吐量的图

tttrrryyy 发表于 2010-7-20 14:10:06

网络瓶颈是可能的,吞吐率过早达到峰值,测一下单个用户单次访问会产生多大的流量。
20000注册用户,那期望同时在线多少?业务高峰发生在什么样的时间区域内?个人认为性能测试属于行为模拟学,你对业务场景不熟悉,测试出来的数据不具备说服力。
TPS这个指标,如果不是类似银行、电信这样的TPS敏感行业,不用过多关注,响应时间最直观。

cen0225 发表于 2010-7-20 14:19:16

从你的图来分析我个人觉的这里面肯定有问题,上面的图是我做的一个web网站的性能测试(多次结果中的一个)

[ 本帖最后由 cen0225 于 2010-7-20 14:21 编辑 ]

z3z3z3z3 发表于 2010-7-20 14:26:32

原帖由 tttrrryyy 于 2010-7-20 14:10 发表 http://bbs.51testing.com/images/common/back.gif
网络瓶颈是可能的,吞吐率过早达到峰值,测一下单个用户单次访问会产生多大的流量。
20000注册用户,那期望同时在线多少?业务高峰发生在什么样的时间区域内?个人认为性能测试属于行为模拟学,你对业务场景不熟悉, ...

客户只给了2万注册用户、假设业务高峰在早上上班的15分钟内,也不知道400人5秒是怎么定出来的,一切都要我们来评估。。。感觉对这个项目很无语,本身产品就有缺陷。。。

z3z3z3z3 发表于 2010-7-20 14:31:41

回复 9# 的帖子

感谢9楼给出的参考
又做了次1人~8人的,吞吐量、每秒点击量、TPS都成明显的上升趋势

[ 本帖最后由 z3z3z3z3 于 2010-7-20 14:33 编辑 ]

kuangquanshui 发表于 2010-7-20 14:59:11

会不会是你的自己压力机出现的问题。看了你的网页分析图接受的时间都是很长,会不会是你的压力机压力太大了有时候也要考虑硬件问题。只是猜测

java_test_liu 发表于 2010-7-20 15:10:29

如果是网络瓶颈的话,一般会有sever shutdown或time out的报错
我以前也有测过处理速度越来越慢的情况,是存储过程临时表设置错误,导致缓存操作超时,最后内存溢出。
你可以设置前端并发数大些,LR运行时间长些,看会不会报错超出内存。

z3z3z3z3 发表于 2010-7-20 15:13:07

我只注意过50、100的时候,8台机的网络占用率、CPU不大都在20%上下,50和100的吞吐就已经没有变化

z3z3z3z3 发表于 2010-7-20 15:13:42

有出现timeout,大概在10%左右

java_test_liu 发表于 2010-7-20 15:25:31

应用服务器上看看运行时候,端口的链接数或java句柄数,会不会释放或增加
如果不变说明程序有问题

tttrrryyy 发表于 2010-7-20 15:26:19

8台机器都是测试机,你怎么不看服务器端的带宽占多少了

z3z3z3z3 发表于 2010-7-20 15:37:17

我怎么看服务器端的带宽?
按照公式:1.5M*8*400/5=960M/s,服务器千兆带宽应该够吧

苏高跃 发表于 2010-7-20 15:41:18

回复 1# 的帖子

你们的指标有哪些,目标是多少才达到要求,你只贴这些图的目的是什么,你怎么说不符合呢?你运行有报错了吗?

z3z3z3z3 发表于 2010-7-20 15:53:47

1.客户期望达到400人5秒响应
2.期望能找到瓶颈,进行优化。
3.运行有timeout,压400人时有10%。50~700人递增时有30%

[ 本帖最后由 z3z3z3z3 于 2010-7-20 15:55 编辑 ]
页: [1] 2 3
查看完整版本: 人数增加,吞吐量不变、每秒点击量不变、TPS下降,可否定义为网络瓶颈