测试基础 简单监控应用日志

难删亦删 · August 01, 2021 · Last by 难删亦删 replied at August 01, 2021 · 2372 hits

一、前言

又是周五,甲方的电话在下班的节点响起,现网又出故障了,赶紧立刻马上给我解决!
身为测试,总是受命于危难之间,在顶锅的前线,战战兢兢,如履薄冰。
"这次是因为用户疯狂点保存,还未加载完数据,就保存,导致存了一个空数据,以致页面被全部清空..."
"上次是研发夹带私货,修改了图片计算的方式,导致全站图片无法上传"
为什么,为什么,每次都如此被动!

二、想法

通过编写 shell 脚本,实时获取应用最新的错误日志,然后发邮件给我
马上去跟运维沟通,是否有编写日志监控脚本,然后他给我讲了一堆困难
算了,自动动手,丰衣足食!
...
在实操过程中,发现用飞书机器人代替发邮件似乎更及时。

三、思路

1.编写监控日志脚本

-时间

-主机

-模块

-报错日志

-日志详情

2.调用飞书机器人

https://www.feishu.cn/hc/zh-CN/articles/360024984973

3.定时任务 crontab

四、实操结果

后台日志

飞书机器人

五、后记

1.记录

1)先在测试环境用用,以前可能前台页面报错,才会去看看后台日志检查是否有错误日志,现在监控了日志目录,在测试过程中,有异常马上就能通知到,正常的 case 哪怕流程通过,可能还有隐藏的问题,不再浮于表面,加一道防线。
2)至于弄在现网环境现在有点难,客户不会允许
3)shell 脚本实现的过程比较简单,主要是种上监控日志的萌芽,测试不止于上线之前的工作;
4)了解到还可用 zabbix、k8s、开源监控平台,但是用 shell 脚本应该是他们的祖宗,简单就完事了,复杂场景无法胜任,哈哈

2.遇到的坎

  • json 转义问题
  • crontab 定时任务环境问题

3.后期优化

  • 解决日志中存在换行符、制表符导致 json 数据报错问题,目前替换为空格
  • 添加报错日志次数统计
共收到 2 条回复 时间 点赞

挺实用的工具,点赞。

提个小建议,如果可能,建议上 ELK,在线查日志和预警都方便很多。

陈恒捷 回复

谢谢大佬指点!😊

需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up