活动沙龙 高峰流量场景实践之可观测与容量运营

TakinTalks稳定性社区 · 2023年02月22日 · 1360 次阅读

沙龙时间:
2023年2月25日14:00-17:00
沙龙地点:
线上直播(infoQ 视频号、51CTO 视频号、TakinTalks-B 站直播间)
进群方式:
扫码添加助理小姐姐,回复「沙龙」进群

👏👏👏福利待你解锁:
扫码添加助理小姐姐,回复「福利」,积极参与活动互动,即可获取书籍《SRE 原理与实践:构建高可靠性互联网应用》一本。

高峰流量场景实践之——「可观测与容量管理」专题

嘉宾与分享主题

@ 张观石 –《SRE 原理与实践:构建高可靠性互联网应用》作者

嘉宾介绍:

资深运维专家和架构师,拥有 20 年软件开发、架构、运维、SRE 经验。历任项目研发负责人、SRE 负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。
为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定的保障体系,多次担任虎牙 “英雄联盟全球总决赛直播” 稳定性保障负责人。在混合多云架构、可观测性、预案、变更管控、AIOps 等 SRE 领域有深入研究和丰富经验。
同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了信通院《信息系统稳定性保障能力建设指南》。《运维前线》一书的联合作者。多次参与 GOPS、MSUP、GDevops 技术大会分享。
分享主题:

《SRE 可观测能力:故障的感知、定位和快恢》

议题概要:

1、以虎牙为例,监控观测技术发展有哪几个阶段?有哪些技术要点?

2、可观测能力在故障生命周期中发挥什么作用?

3、实践案例:虎牙可观测能力介绍及亮点成效

听众收益:

1、能了解可观测性的相关知识、重要性;

2、学习到如何通过 SRE 观测能力来感知互联网平台的故障,加快发现定位和修复决策;

适合人群:

运维工程师、系统架构师、软件开发工程师

嘉宾与分享主题

@ 张鹤 –哔哩哔哩 资深 SRE 专家

嘉宾介绍:

2020 年加入 B 站,先后负责主站/直播/OGV/推广搜相关的 SRE 工作,深度参与多活,活动保障,混沌工程,容量治理相关的建设,主导容量管理平台,混沌平台的架构设计和落地,负责 B 站 S 赛、跨年晚会、拜年祭等相关活动的基础架构保障工作,目前主要负责推广搜业务的稳定性建设。
分享主题:

《容量管理之可视化运营》

议题概要:

随着近几年降本增效的大背景,以及 k8s 云原生的普及,容量资源的可视化显得尤为重要,本次分享重点介绍 B 站如何落地容量管理,以及基于容量数据赋能业务。

听众收益:

1、如何构建一套容量可观测体系?

2、如何整合碎片化资源,为业务保驾护航?

3、降本增效的大背景下,B 站的容量管理都遇到哪些问题,是如何解决的?

适合人群:

SRE 工程师、研发、架构师,测试等

主办方_「TakinTalks」

「TakinTalks」是联合业界专家共同发起的稳定性技术交流平台,面向技术管理者与一线技术专家,定期探讨行业前沿技术,分享最佳实战经验。让技术知识的传播没有界限。
聚焦 SRE 稳定性领域
与业界 TOP 技术专家近距离交流
与 3000+ 同行探讨技术经验

合作媒体

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册