高峰流量场景实践之可观测与容量运营

开始时间: 2023-02-25 14:00:00 周六
结束时间: 2023-02-25 17:00:00 周六
举办地点: 线上举办
报名已截止 活动已结束

沙龙时间: 2023年2月25日14:00-17:00 沙龙地点: 线上直播(infoQ 视频号、51CTO 视频号、TakinTalks-B 站直播间) 进群方式: 扫码添加助理小姐姐,回复「沙龙」进群 👏👏👏福利待你解锁: 扫码添加助理小姐姐,回复「福利」,积极参与活动互动,即可获取书籍《SRE 原理与实践:构建高可靠性互联网应用》一本

高峰流量场景实践之——「可观测与容量管理」专题

嘉宾与分享主题

@ 张观石 –《SRE 原理与实践:构建高可靠性互联网应用》作者

嘉宾介绍:

资深运维专家和架构师,拥有 20 年软件开发、架构、运维、SRE 经验。历任项目研发负责人、SRE 负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。 为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定的保障体系,多次担任虎牙 “英雄联盟全球总决赛直播” 稳定性保障负责人。在混合多云架构、可观测性、预案、变更管控、AIOps 等 SRE 领域有深入研究和丰富经验。 同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了信通院《信息系统稳定性保障能力建设指南》。《运维前线》一书的联合作者。多次参与 GOPS、MSUP、GDevops 技术大会分享。

分享主题:


《SRE 可观测能力:故障的感知、定位和快恢》

议题概要:

1、以虎牙为例,监控观测技术发展有哪几个阶段?有哪些技术要点? 2、可观测能力在故障生命周期中发挥什么作用? 3、实践案例:虎牙可观测能力介绍及亮点成效





听众收益: 1、能了解可观测性的相关知识、重要性; 2、学习到如何通过 SRE 观测能力来感知互联网平台的故障,加快发现定位和修复决策; 适合人群: 运维工程师、系统架构师、软件开发工程师

嘉宾与分享主题

@ 张鹤 –哔哩哔哩 资深 SRE 专家

嘉宾介绍:

2020 年加入 B 站,先后负责主站/直播/OGV/推广搜相关的 SRE 工作,深度参与多活,活动保障,混沌工程,容量治理相关的建设,主导容量管理平台,混沌平台的架构设计和落地,负责 B 站 S 赛、跨年晚会、拜年祭等相关活动的基础架构保障工作,目前主要负责推广搜业务的稳定性建设。

分享主题:



容量管理之可视化运营

议题概要:

随着近几年降本增效的大背景,以及 k8s 云原生的普及,容量资源的可视化显得尤为重要,本次分享重点介绍 B 站如何落地容量管理,以及基于容量数据赋能业务。

听众收益: 1、如何构建一套容量可观测体系? 2、如何整合碎片化资源,为业务保驾护航? 3、降本增效的大背景下,B 站的容量管理都遇到哪些问题,是如何解决的?


适合人群: SRE 工程师、研发、架构师,测试等




主办方_「TakinTalks」

「TakinTalks」是联合业界专家共同发起的稳定性技术交流平台,面向技术管理者与一线技术专家,定期探讨行业前沿技术,分享最佳实战经验。让技术知识的传播没有界限。
  • 聚焦 SRE 稳定性领域
  • 与业界 TOP 技术专家近距离交流
  • 与 3000+ 同行探讨技术经验

合作媒体

评论列表
暂无评论.
活动组织者
主办方 TakinTalks

分享扩散