性能问题分析
CPU问题1.现象
系统访问卡顿,QPS、TPS降低,响应时间延长,网络吞吐量降低;
应用服务器内存和IO正常,CPU利用率增高
2.原因
线程太多,上下文切换太频繁;
GC回收使用了过高的CPU资源;
某段代码陷入了死循环;
锁争用激烈
3.解决方法(主要解决CPU的问题)
考虑使用更高级的CPU代替当前的CPU
对于多CPU,考虑CPU之间的负载分配
考虑在其他体系上设计系统,例如增加前置机,设置并行服务器
定位耗时最高的线程,将需要的线程ID替换成16进制格式,并打印线程的堆栈信息,找到出现问题的代码
内存问题
1.现象
项目内存持续增加;
响应时间成规律性的先增加后回落;
查看应用日志,会出现OutOfMemoryError错误;
GC日志发出FULL GC警告;
系统长时间运行后出现访问错误或宕机
2.原因
启动参数内存值设定得过小;
代码中存在死循环或者循环产生过多重复的对象实体;
集合类中有对对象的引用,使用完后未清空,使JVM不能回收;
使用的第三方软件中有GUB
3.解决办法(主要解决内存的问题)
保证保留列表具有较大的邻接内存块
调整数据块缓冲区大小(用数据块的个数表示)
将最频繁使用的数据保存在存储区中
磁盘IO问题
1.现象
磁盘读写速率、IOPS过高,系统出现卡顿
2.原因
SQL写法、参数配置不合理;
交换机故障,网线老化;
存储针列条带宽不足,缓存不足,Qos限制,RAID级别设置不当
3.解决办法(主要解决磁盘IO的问题)
通过把日志和数据库对象分布在独立的设备上
把不同的数据库放在不同的硬盘上
数据库问题
1.现象
QPS、TPS降低,CPU使用率超高导致宕机;
磁盘IO过高,网卡IO被占满
2.原因
SQL查询速度慢,语句效率低下;
服务器硬件性能差;
表数据文件巨大,表单超过千万行;
资源锁定造成数据库事务超时,数据库死锁;
事务粒度过大
3.解决办法(主要解决数据库的问题)
定位资源占用较大的事务并做出必要的优化或调整
定位锁冲突,修改锁冲突发生严重的应用逻辑
对规模较大的数据或者无法通过一般优化解决的锁冲突进行分布
分表分库:减少表单的记录条数,减少数据查询所需的时间,提高数据库的吞吐;对数据库进行拆分,提高数据库的写入能力
考虑采用分布式的cache层
实现MySQL数据库异步查询,MySQL读写分离
页:
[1]