沙龙时间:
2023年2月25日14:00-17:00
沙龙地点:
线上直播(infoQ 视频号、51CTO 视频号、TakinTalks-B 站直播间)
进群方式:
扫码添加助理小姐姐,回复「沙龙」进群
👏👏👏福利待你解锁:
扫码添加助理小姐姐,回复「福利」,积极参与活动互动,即可获取书籍《SRE 原理与实践:构建高可靠性互联网应用》一本。
高峰流量场景实践之——「可观测与容量管理」专题
嘉宾与分享主题
@ 张观石 –《SRE 原理与实践:构建高可靠性互联网应用》作者
嘉宾介绍:
资深运维专家和架构师,拥有 20 年软件开发、架构、运维、SRE 经验。历任项目研发负责人、SRE 负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。
为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定的保障体系,多次担任虎牙 “英雄联盟全球总决赛直播” 稳定性保障负责人。在混合多云架构、可观测性、预案、变更管控、AIOps 等 SRE 领域有深入研究和丰富经验。
同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了信通院《信息系统稳定性保障能力建设指南》。《运维前线》一书的联合作者。多次参与 GOPS、MSUP、GDevops 技术大会分享。
分享主题:
《SRE 可观测能力:故障的感知、定位和快恢》
议题概要:
1、以虎牙为例,监控观测技术发展有哪几个阶段?有哪些技术要点?
2、可观测能力在故障生命周期中发挥什么作用?
3、实践案例:虎牙可观测能力介绍及亮点成效
听众收益:
1、能了解可观测性的相关知识、重要性;
2、学习到如何通过 SRE 观测能力来感知互联网平台的故障,加快发现定位和修复决策;
适合人群:
运维工程师、系统架构师、软件开发工程师
嘉宾与分享主题
@ 张鹤 –哔哩哔哩 资深 SRE 专家
嘉宾介绍:
2020 年加入 B 站,先后负责主站/直播/OGV/推广搜相关的 SRE 工作,深度参与多活,活动保障,混沌工程,容量治理相关的建设,主导容量管理平台,混沌平台的架构设计和落地,负责 B 站 S 赛、跨年晚会、拜年祭等相关活动的基础架构保障工作,目前主要负责推广搜业务的稳定性建设。
分享主题:
《容量管理之可视化运营》
议题概要:
随着近几年降本增效的大背景,以及 k8s 云原生的普及,容量资源的可视化显得尤为重要,本次分享重点介绍 B 站如何落地容量管理,以及基于容量数据赋能业务。
听众收益:
1、如何构建一套容量可观测体系?
2、如何整合碎片化资源,为业务保驾护航?
3、降本增效的大背景下,B 站的容量管理都遇到哪些问题,是如何解决的?
适合人群:
SRE 工程师、研发、架构师,测试等
主办方_「TakinTalks」
「TakinTalks」是联合业界专家共同发起的稳定性技术交流平台,面向技术管理者与一线技术专家,定期探讨行业前沿技术,分享最佳实战经验。让技术知识的传播没有界限。
聚焦 SRE 稳定性领域
与业界 TOP 技术专家近距离交流
与 3000+ 同行探讨技术经验
合作媒体