开发
-
混沌工程入门:新手如何安全玩转,别急着炸生产环境!
各位同行们好,我是老王。最近总看到一些新手朋友对“混沌工程”摩拳擦掌,跃跃欲试。这股子热情是好事,说明大家对系统韧性越来越重视了。但老王也发现,不少新手一上来就想搞个大新闻,直接在生产环境“搞破坏”,或者注入那种破坏力极强的故障类型。这,...
-
如何把复杂技术和间接收益,高效地讲给非技术管理者?
“老板只关心投入产出比”——这句话是不是很多技术同学的心声?确实,非技术背景的管理者,他们的核心职责往往是把控成本、提升效益、规避风险。我们讲再多“高并发”、“微服务”、“异步架构”这些技术词汇,如果不能转化成他们听得懂的“业务语言”,那...
-
SRE老兵谈生产环境混沌工程:安全是底线,协作是艺术
最近看到不少同行对混沌工程很感兴趣,特别是如何在生产环境"搞事情"同时不影响用户体验,以及除了技术手段,团队协作和沟通有什么秘诀。作为摸爬滚打多年的老兵,我想跟大家分享一些我的“土办法”和心得。 一、生产环境搞混...
-
生产环境搞混沌工程?别怕,这些“安全绳”帮你稳稳落地!
实施混沌工程(Chaos Engineering)的目的,是为了主动发现系统在面对异常时的弱点,从而提升系统的韧性。然而,许多团队,特别是对服务中断零容忍的系统,最大的顾虑就是实验失控,反而引发真实的生产事故。这个担忧非常真实且有道理。要...
-
混沌工程初体验:为什么总是找不到问题?常见误区与实战清单
老铁,你这问题问到点子上了!我当年刚接触混沌工程(Chaos Engineering)的时候,也跟你一样,注入个故障,日志风平浪静,监控曲线纹丝不动,感觉像在做无用功。当时真怀疑是不是系统太强壮,或者我的操作姿势不对。后来才明白,这真的是...