活动沙龙 11 月 20 日直播|去哪儿网 1-5-10 故障体系建设——秒级监控预警落地实践

TakinTalks稳定性社区 · 2024年11月06日 · 82 次阅读

去哪儿旅行因应酒店订单激增,需提升故障预警能力。现有监控系统 watcher 仅提供分钟级数据,导致故障发现延迟,影响订单赔付和品牌信任。为减少订单损失,迫切需要实现秒级监控精度。

11 月 20 日晚 19:30,梁成琰和李越老师将会在线和大家一起探讨去哪儿网通过秒级监控预警,将故障发现时长从 4 分钟降至 1 分钟内,显著提升了故障响应速度。核心业务指标如订单量、交易失败率等实现秒级监控,故障 1 分钟发现率和预警准确率稳步提升。

直播预告:

分享人:
梁成琰  去哪儿网资深 devops 工程师
李越  去哪儿网资深测试工程师

内容亮点:
1、去哪儿网是如何实现从分钟级到秒级监控预警的精度提升的?
2、在秒级监控预警落地实践中,去哪儿网是如何解决存储 IO 过高和占用空间过大的问题的?
3、与分钟级监控相比,去哪儿旅行的秒级监控预警系统是如何将故障发现时长从 4 分钟缩短至 1 分钟内的?

观看方式:
扫描下方二维码即可预约直播

合作媒体:

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册