大家测试环境加日志监控了吗?有哪些弊端,有哪些收益?
除了废开发外,就全剩收益了呀,定位方便,跟踪方便~
这都是开发要做的事,默认是加的,还没见过没有日志的项目
不知道日志监控具体是指啥,是指类似 ELK 的日志统一采集和查找,还是日志错误数达到一定程度自动预警,还是别的。
楼主先明确说下?
日志加了, 如果是和产线一套模板/服务, 也不怎么费开发。
日志留存个 1 天/周( 根据你们测试场景),也没有很大开销, 按需测试也没那么多的流量。
好处就是, 容易朔源, 也方便定位问题。
监控的好处就不用说了,测试环境不加监控,挂了你都不知道。后面就各种项目来了临时救火修环境。
最简单就是把现有的自动化测试, 在测试环境每天跑一版,能定期回归,又能保证测试环境可用性。
利远大于弊
这个要看你这报警的阈值是怎么设置的。
如果是抛个异常就预警,估计会很多(很可能出个 bug 就异常了,或者是历史原因系统存在很多其实不用关注的异常)很快就疲了,加了等于没加
如果是能限制为影响环境主流程才预警,那会比较有效,但会比较难,因为从日志其实很难区分,比较有效的是 4 楼所说的,在测试环境里跑已有的自动化用例(特别是流程类的),不通过的时候预警。我们之前是加了主流程自动化的失败监控,30 分钟跑一次并且自带重试机制(有可能刚好某个服务在部署,引起失败),如果重试还是失败就预警。
个人看法,只要不是过度监控,就是有做得必要。
收益:
但是在具体实施时要考虑一些因素: