活动沙龙 「TakinTalks」_ 系统故障频发,如何避免重复踩坑?

TakinTalks稳定性社区 · 2022年08月16日 · 1905 次阅读

沙龙时间:2022年8月20日,14:00-17:00

沙龙地点:线上直播(infoQ 视频号、B 站直播间)

进群方式:

扫码添加小树,回复「沙龙」进群;

故障专题:

通过一二线大厂的典型故障事件出发,剖析故障成因,介绍治理故障的实践经验和技术演进,并为如何做好故障复盘提供一定的参考,帮助大家可以更从容淡定、有章可循地做好系统稳定性建设。

嘉宾与分享主题:

@ 石鹏 - 美图 高级运维经理

  • 嘉宾介绍:

2016 年加入美图,运维技术专家,美图产品 SRE 负责人。目前在美图负责社区、商业化、医美、实验室等全线产品的运维保障工作,同时参与公司日志、监控等基础设施的建设。

参与或主导过多次公司基础设施的调整、改造,在监控、灾备、故障管理、稳定性运营等方面有一定的经验和积累。

  • 分享主题:

《稳定性运营之故障治理》

  • 听众收益:

了解稳定性运营的宏观框架,获得故障管理的方法体系,吃到几口本人线上实际踩坑的瓜~

  • 适合人群:
  • SRE/运维工程师
  • 运维团队负责人/业务团队一线管理者
  • 对稳定性治理、故障管理感兴趣的同学


@ 史军蜓 - 浙江移动 SRE 架构师

  • 嘉宾介绍:

9 年 SRE 经验,专注于云原生、微服务架构、高可用架构设计等。现为浙江移动稳定性体系建设及混沌工程负责人,牵头或参与了多项中国移动集团内稳定性及故障演练的标准制定及解决方案落地。

  • 分享主题:

《走出故障迷局的三重奏:逃生、复盘和推演》

  • 听众收益:

介绍故障处理的应对方式,从前置标准化系统的多活架构开始,构建应用多活体系,而后在标准化处置的基础上推行有效的故障复盘机制,并结合推演体系,贯通面向失败的架构设计,增强系统原生的鲁棒性。

  • 适合人群:

SRE 工程师、研发、架构师等

主办方_ TakinTalks

「TakinTalks」是联合业界专家共同发起的稳定性技术交流平台,面向技术管理者与一线技术专家,定期探讨行业前沿技术,分享最佳实战经验。让技术知识的传播没有界限。

  • 聚焦 SRE 稳定性领域
  • 与业界 TOP 技术专家近距离交流
  • 与 3000+ 同行探讨技术经验

合作媒体

报名活动,超多福利奖品大放送

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册