又是周五,甲方的电话在下班的节点响起,现网又出故障了,赶紧立刻马上给我解决!
身为测试,总是受命于危难之间,在顶锅的前线,战战兢兢,如履薄冰。
"这次是因为用户疯狂点保存,还未加载完数据,就保存,导致存了一个空数据,以致页面被全部清空..."
"上次是研发夹带私货,修改了图片计算的方式,导致全站图片无法上传"
为什么,为什么,每次都如此被动!
通过编写 shell 脚本,实时获取应用最新的错误日志,然后发邮件给我
马上去跟运维沟通,是否有编写日志监控脚本,然后他给我讲了一堆困难
算了,自动动手,丰衣足食!
...
在实操过程中,发现用飞书机器人代替发邮件似乎更及时。
-时间
-主机
-模块
-报错日志
-日志详情
https://www.feishu.cn/hc/zh-CN/articles/360024984973
后台日志
飞书机器人
1)先在测试环境用用,以前可能前台页面报错,才会去看看后台日志检查是否有错误日志,现在监控了日志目录,在测试过程中,有异常马上就能通知到,正常的 case 哪怕流程通过,可能还有隐藏的问题,不再浮于表面,加一道防线。
2)至于弄在现网环境现在有点难,客户不会允许
3)shell 脚本实现的过程比较简单,主要是种上监控日志的萌芽,测试不止于上线之前的工作;
4)了解到还可用 zabbix、k8s、开源监控平台,但是用 shell 脚本应该是他们的祖宗,简单就完事了,复杂场景无法胜任,哈哈