混沌工程 使用 Litmus pod-stress 无法注入故障

zzz · 2023年12月16日 · 2448 次阅读

背景

失业了,没事只能在家开发故障框架,想直接把一些 Litmus 的故障加入进来吧,这样好快速达成我的目的。

一开始还好,operator 项目也快速的起来了,抛弃了之前一直用来存数据的 MySQL,这下全云原生了算是,后边在自己的 colima+k3s+docker 的环境里一跑,诡异的就来了,根本就起不来了。心想不对吧,之前在公司里还跑过妹问题啊,那么开始分析时间。

分析

看到的日志里出现这么一条。

level=fatal msg="helper pod failed, err: fail to get the cgroup manager, err: Error loading cgroup v2 manager, cgroups: invalid group path"

看样子是 cgroup2 被启用了?那么到 qemu Linux 虚拟机中再确认一下,果然诶

$ grep cgroup /proc/filesystems
nodev   cgroup
nodev   cgroup2

那么就没问题了,就是 cgroup2 相关的代码逻辑里有问题了。然后就开始搜索 stress helper 里相关的代码,找到这行日志报错的地方。我用的是 2.14 的代码,所以直接切了 v2.14.x 的分支了,大概就是在 stress-helper.go 的 468 行里有这么一段。

if cgroups.Mode() == cgroups.Unified {
    groupPath, err := cgroupsv2.PidGroupPath(pid)
    if err != nil {
        return nil, errors.Errorf("Error in getting groupPath, %v", err)
    }

    cgroup2, err := cgroupsv2.LoadManager("/sys/fs/cgroup", groupPath)
    if err != nil {
        return nil, errors.Errorf("Error loading cgroup v2 manager, %v", err)
    }
    return cgroup2, nil
}

这个cgroupsv2.LoadManager函数我检查了一下,最后其实也就是把这两个路径拼起来而已,那我只能猜这个路径有问题了。那么再检查这个groupPath是怎么得到的了。

一路检查上边的cgroupsv2.PidGroupPath的函数到containerd/cgroups包里,最终应该是这样的。

func parseCgroupFromReader(r io.Reader) (string, error) {
    var (
        s = bufio.NewScanner(r)
    )
    for s.Scan() {
        var (
            text  = s.Text()
            parts = strings.SplitN(text, ":", 3)
        )
        if len(parts) < 3 {
            return "", fmt.Errorf("invalid cgroup entry: %q", text)
        }
        // text is like "0::/user.slice/user-1001.slice/session-1.scope"
        if parts[0] == "0" && parts[1] == "" {
            return parts[2], nil
        }
    }
    if err := s.Err(); err != nil {
        return "", err
    }
    return "", fmt.Errorf("cgroup path not found")
}

就和注释里写的一样,最终应该是返回了:分割后的 slice 的第 2 个 index 的字符串,前提条件是这玩意是我们预期得到的东西。按照这个代码里的逻辑,我又去查看了/proc/<pid>/cgroup 里的内容,在容器下我看到的就不对了,返回的内容就变成了这样的。

root@chaos-79bb494f5-82dz5:/litmus# cat /proc/5071/cgroup 
0::/../../../podd4938737-4c89-4c19-9023-bf251a10ee30/5a860022668d90b18979f4ea5da843dee065db24133e5f3a14b4e0dbb03c8835

很显然,最终我们得到的这个groupPath的结果其实是

/../../../podd4938737-4c89-4c19-9023-bf251a10ee30/5a860022668d90b18979f4ea5da843dee065db24133e5f3a14b4e0dbb03c8835

但如果我直接在 host 的 shell 环境下,看到的却是

0::/kubepods/podd4938737-4c89-4c19-9023-bf251a10ee30/5a860022668d90b18979f4ea5da843dee065db24133e5f3a14b4e0dbb03c8835

然后我仔细看了一遍 Linux Kernel 里关于 cgroup v2 的相关文档,看到一段是这么描述的。

From a sibling cgroup namespace (that is, a namespace rooted at a different cgroup), the cgroup path relative to its own cgroup namespace root will be shown. For instance, if PID 7353's cgroup namespace root is at '/batchjobs/container_id2', then it will see:

# cat /proc/7353/cgroup
0::/../container_id2/sub_cgrp_1

恍然大悟了,难怪我看不到绝对路径了。那么这问题就简单了,我直接切换到 root namespace 不就行了。于是在容器中这样跑

root@chaos-79bb494f5-82dz5:/litmus# nsenter -t 1 -C -- cat /proc/5071/cgroup 
0::/kubepods/podd4938737-4c89-4c19-9023-bf251a10ee30/5a860022668d90b18979f4ea5da843dee065db24133e5f3a14b4e0dbb03c8835

这样我们就得到了一个正确的绝对路径。
修复完后,我又重新跑了一遍,还是有错,但是这次一样了,变成了

fail to add the stress process into target container cgroup, err: Permission Denied

大致上是这个错误,可能没写全,不过就是这个意思,没权限去写入那个文件。那么到这里,再次进入源代码检查。

挂载进目标 cgroup 的问题

还是一样的 stress-helper.go,但是这次去了 146 行的位置,代码如下

if err = addProcessToCgroup(cmd.Process.Pid, cgroupManager); err != nil {
    if killErr := cmd.Process.Kill(); killErr != nil {
        return errors.Errorf("stressors failed killing %v process, err: %v", cmd.Process.Pid, killErr)
    }
    return errors.Errorf("fail to add the stress process into target container cgroup, err: %v", err)
}

点进去后,继续往下深挖,最后到了又回到了containerd/cgroups里,其实整个代码不难,就是往刚才找到的 cgroup 路径下的cgroup.procs文件里写入 pid,仅此而已。那么好了,我们自己在容器里用 shell 直接试试看。

root@chaos-79bb494f5-82dz5:/litmus# echo 11147 >> /sys/fs/cgroup/kubepods/podd4938737-4c89-4c19-9023-bf251a10ee30/5a860022668d90b18979f4ea5da843dee065db24133e5f3a14b4e0dbb03c8835/cgroup.procs 
bash: echo: write error: No such file or directory

按照我之前的经验,盲猜还是因为我并不在 host namespace 的问题,那么还是有请我们的老朋友nsenter

root@chaos-79bb494f5-82dz5:/litmus# nsenter -t 1 -C -- sudo sh -c "echo 11147 >> /sys/fs/cgroup%s/cgroup.procs"

运行完后,不报错了,那么我们再检查一下是不是真的进去了

root@chaos-79bb494f5-82dz5:/litmus# cat /sys/fs/cgroup/kubepods/podd4938737-4c89-4c19-9023-bf251a10ee30/5a860022668d90b18979f4ea5da843dee065db24133e5f3a14b4e0dbb03c8835/cgroup.procs
23890
12483
11147

至此,应该问题全部解除。那么将相关的修复代码提交到stress-helper.go里,然后重新编译打包 image,再跑一次。

最终,我看到了指标数据在目标容器中出现了,确认修复是有效的。

参考资料

cgroup-v2

Litmus 相关 issue

最终我还是提了个 PR 修复这个问题

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册