测试管理 关于线上 bug

finer · December 04, 2019 · Last by 九北鱼 replied at December 06, 2019 · 1293 hits

写在前面
之所以想写下线上bug,因为发觉有些公司对线上bug的处理是比较严格甚至是很苛刻,涉及到的相关人可能会因此而背黑锅。

之所以会存在这样情况,因为公司各部门都有关联,特别是用户、老板的投诉,也给公司会造成直接口碑或经济等重大损失。

第一节

 下面举几个实际发生过的关于线上bug的例子:

1.一个修改update操作,结果引起删除delete了一条数据;

    问题追溯:实际上测试漏测了,导致项目开发leader辞退,团队扣奖金。 

2.一个地图上的所有目标加油站数据加载不出来;

    问题追溯:实际上因为客户端app上线了,但是那晚后台开发同事未加班,后台api及数据未同步上线,从而导致这个问题,测试leader辞退。

3.一个活动, 1分钱团购旅游门票,预计是放出300张,结果未做限制导致被抢了过多超10000张,导致华侨城景点游客堵塞混乱;

     问题追溯:实际上是系统未设置默认张数,业务部门也未设置,用户可以无限制抢购,抢到门票的人过多引起堵塞和导致投诉并造成损失。

第二节

线上的问题,有用户咨询类、用户操作不当类,那么其他可以归属于系统bug即生产事故:

1.一方面我们又要有效预防生产事故,因为测试的一个比较重要职责是暴漏风险,保障质量,要起到防火的作用,而不应是把重点放在救火;

衡量指标:缺陷密度

2.一方面我们不太可能100%的保证线上没有任何一个bug,这时要救火;

衡量指标:漏测率

那么我们思考怎样去做会比较好呢,其实每个公司都不完全一样,但是我们尽可能细致入微的方向去做肯定是没有错的

1.防火:测试流程规范,进行线下充分高效测试,充分暴漏问题;产品项目流程规范及时解决线下bug;线上也进行冒烟测试等;

这个过程做的足够好,其实线上bug风险,我们通常也是在可控范围内的。

2.救火:有效及时处理掉线上bug。

第三节

1:线上bug测试处理过程

2:线上bug研发处理过程

3:线上bug详情及进度

4:线上bug功能分类统计

5:线上bug环境分类统计

6:线上bug定级标准

7:线上bug总结优化

后记
通过收集,分析,总结,从而对重复出现2次及以上的bug,要防止再次出现该问题,重点找出原因并优化改善,结合产品部门、开发组开会商讨,想出解决方案,并入下一个版本需求开发计划。

共收到 11 条回复 时间 点赞

看你的例子,只能说贵公司处分很严格,但是流程有点儿戏。
例如问题2,在正式发布APP之前不需要测试吗? 而且是测试leader被炒了,难道是他同意在后台API没上线的时候上线的?

Jerry li 回复

应该是他没发现后台那人没加班导致数据没有同步

实际上因为客户端app上线了,但是那晚后台开发同事未加班,后台api及数据未同步上线,从而导致这个问题,测试leader辞退

笑死我了~

3.一个活动, 1分钱团购旅游门票,预计是放出300张,结果未做限制导致被抢了过多超10000张,导致华侨城景点游客堵塞混乱;

感觉这个产品 运营都比较没有经验,或者说是国企作风,测试的锅反而不是很大

秦岭 回复

测试有没有锅还不清楚,鬼知道是需求如此还是彼此都遗漏了

married577 回复

既然楼主提到了这个,那么!很简单,就是之后复盘的时候,拉测试出来,想让测试来承担责任,这也是领导不重视测试利益,反而想让测试多担责任的表现,不少小公司就是这样

举的几个例子
1.codereview和测试都应该可以找出来
2.说段子呢。。
3.产品、测试、运维都有责任,运维责任更大。

总的来说,线上出了问题,没有哪个能完全脱离干系。SB公司才会找单独的背锅侠。加班那个段子成功逗笑了我

Author only
Ouroboros 回复

真的是SB公司才会找单独的背锅侠..+1

关于问题2,发布生产后没有进行走查测试吗?需要数据同步的,上线前没有进行物料的checklist吗?QA不被重视的公司,QA容易背锅侠没有话语权

需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up