图床失效的话,请关注二维码查阅哦😯
扫一扫,关注我
简单来说:在复杂多变情况下,保证系统稳定
百度百科说:
服务器监控
数据库监控
Docker 监控
JVM 监控 Grafana
JVM 监控 VisualVM
数据库问题分析
堆内存泄漏排查
死锁问题排查
JVM 分析
Arthas 调优工具
超时概率:小于0.5‰
错误概率:小于0.5‰
TPS:大于期望高峰值
CPU利用率:小于75%
响应时间:小于期望时间
Load负载:平均没核CPU的Load小于1
JVM内存使用率:小于80%
FullGC频率:平均大于半小时1次
TPS 和响应时间曲线抖动不能过于强烈,具备一定梯度,整体趋势应该是趋近与平稳
如下图在线程数增加的时候,TPS 一个比较正常的图示,持续增加后,在 13000TPS 的位置趋近平稳,有一定梯度
如下 TPS 和响应时间的图例,可以用作正常类参考
如下图在线程数增加的时候,响应时间在 1s 一下缓慢增涨,当 TPS 到达高点 13000 以后,随时线程持续增加,响应时间增速加剧
不太合理的 TPS 图
波动幅度剧烈,找不到 TPS 的稳定峰值,不利于问题分析,性能测试结果不准确
梯度不明显,可以考虑增加 Ramp-up,让 TPS 增幅变缓,否则响应时间的图也不会出现稳定期,较难做出峰值判断
TPS 在某些点有突然下降,需要做出排查
扫一扫,关注我