前言
关于如何运用 docker 来解决现实问题并非是一个新鲜的问题,关于 docker 在测试方面的应用也有很多的文章,本篇是在前人的基础上研究了如何结合业务逻辑构建基于 docker 的分布式测试系统。当然初次研究肯定有很多不完善的地方,希望抛砖引玉,如果在阅读过程中有什么问题,欢迎大家留言交流。废话不多说了,本系列共 2 篇 6 个部分,涵盖了从项目开始到结束的所有基本过程。本篇介绍前 2 个部分,分别为构建测试系统的需求以及搭建 docker 镜像,希望本篇文章对你有所帮助。
---- 搜狗 ADTQ 测试组出品
现在部门内每次有新的需求上线,都会对之前所有的 cases 进行回归。cases 的数量比较大,每次回归 case 需要花费很长的时间,部门内现在已有一个分布式的回归工具,是基于 Jenkins 的 api 和 Shell 来做的,虽然实现了基本的分布式的功能,但是也有一些弊端在后续的实践中慢慢显现,主要有以下几个方面:
case 回归的时间很长。case 回归的时间长主要有两个方面的原因造成:第一个原因是分布式节点比较少,这使得分布式的优势并没有完全凸显出来;第二个原因是轮询检查子节点的完成情况,并设置超时的时间,超时时间过短则不能完成收集子节点结果的任务,而超时时间过长则进一步延长了 case 回归的时间
分布式子节点新增困难。当 case 量上升,需要新增子节点的时候,发现这并非是一件很容易的事情。由于子节点是 jenkins 的 node 节点,所以每次新增节点都相当于部署一个 jenkins 节点,并需要将任务代码 rsync 到新的节点中。这对于一个新手来说是很不方便的,不利于后期维护。
结果展示不够直观。现有的结果展示只有邮件的形式,当运行完成之后通过邮件来通知分布式程序运行的结果,如果你想查看某一个文件中 case 的执行情况,比如该文件中有多少 case 成功,或者有多少 case 失败,抱歉,这并不提供这个功能。你收到的邮件只是一堆失败 case 的集合。
当然还有一些其他的弊端,但是主要的问题就是以上的三个方面。后续在解决这三个问题的基础上,也完善了其他的功能,比如 case 的执行粒度、case 的执行情况统计等等。所以在充分调研了现有的分布式工具的基础上,我们提出了新的需求,新需求主要有以下几个方面:
有了需求我们才开始着手新分布式测试工具的开发工作,后续的章节将会从各个方面进行阐述。
对于一个刚开始接触 docker 的新手,一切都是新的,所以就从最开始说起,说说搭建 docker 镜像的那些事以及踩过的那些坑吧。。。
1、搭建基础 docker 镜像
Build docker 镜像之前,首先要了解的是你的服务程序是运行在哪个 linux 版本之下的,是 Ubuntu 还是 Redhat 或者其他,尽量选择与现有的平台一致的镜像,如果能具体到 linux 的版本号就最好了。当然如果你说我的程序是通用类型,具体的版本并不重要,那么选择一个你熟悉的镜像就 ok 了。比如我的服务端程序是运行在 redhat6.5 下,那么我会选择 Centos6.5 的版本作为我的基础镜像。
选择与现有平台一致的镜像有利于后续问题的排查,一般你对服务端程序代码的熟悉程度肯定比不了开发,甚至连一知半解都做不到,如果选择不一致的运行平台,如果出现了问题,你可能无法确定是什么原因导致的,是平台? or 自有的服务端程序? ,而选择一致性平台则排除了这一问题。
服务端程序以 c++ 为例,都会依赖很多的库,而下载下来的镜像是纯净的系统,所以第一步就是按照程序运行的依赖包。如果开发能给出一个依赖包的列表最好,如果不能,那么尝试着运行程序,将缺少的依赖包记录下来,以便制作 dockerfile 文件。当你尝试着将所有的依赖包安装完整,并且服务端程序可以正常的启动起来,那么 dockerfile 文件也就差不多制作完成了。
关于 dockerfile 文件的基础语法我就不再这里详述了,不懂的 搜狗(这是广告,哈哈...)一下吧。下面是我自己制作的 dockerfile 文件,或许对你有些帮助
# Dockfile to install bidding module dependency
# Based on Centos:6.5
FROM centos:6.5
# to replace the origin CentOS-Base.repo
WORKDIR /etc/yum.repos.d
RUN mv CentOS-Base.repo CentOS-Base.repo.backup
# Add new CentOS-Base.repo
ADD CentOS-Base.repo /etc/yum.repos.d/
# Install dependency package
RUN yum install gcc g++ gcc-c++
RUN yum install curl libcurl-devel
RUN yum install boost boost-devel boost-doc
RUN yum instlal zlib zlib-devel
RUN yum install openssl openssl-devel
# Set CXX and CC
RUN echo "export CC='gcc -std=gnu99'" >> /etc/profile
RUN echo "export CXX='g++ -std=gnu++0x'" >> /etc/profile
CMD ["/bin/bash"]
2、从安装 docker 到构建完镜像踩过的那些坑
从开始接触到后续构建完成,一路走来,跌跌撞撞,幸好问题都已解决,现就碰到的问题与大家分享一下,或许你也正被其中的某一问题所困扰
(1)关于 docker 安装过程中,离线安装的问题(仅限 centos 系列):
docker 是可以离线安装的,有离线安装包。如果是离线安装则需要按照 cgroup 依赖包,http://mirrors.163.com/centos/6/os/x86_64/Packages/。在这篇文章中写的比较清楚:http://www.iyunv.com/thread-149007-1-1.html,可根据 Centos 的版本以及安装包依赖,切记不可照搬照抄。如果是可以上外网,最好还是线上安装吧,比如在 Ubuntu 下,docker 的安装一条命令就可以了:
curl -sSL https://get.daocloud.io/docker | sh
(2)关于 centos6 下升级 docker 引擎到 1.2.1 版本
docker 引擎的 1.2.1 版本集成了新的 swarm,所以如果有可能还是使用 1.2.1 以后版本的 docker。但是对于 centos6 来说,如果要升级到 1.2.1 版本,则安装的包需要依赖 systemd,但 Centos6 无法安装 systemd。
关于这个问题的回答可详细查看:http://stackoverflow.com/questions/28347694/how-to-install-systemd-on-centos-6-6,其中在这篇文章说的在 Centos6 中安装 docker-engine1.2.1,会出现依赖包缺失的错误。http://blog.csdn.net/weiguang1017/article/details/52293235,这篇文章也介绍了如何安装,但是我尝试后还是无法在 centos6 下无法升级到 1.2.1 以上版本,如果有成功的同学,麻烦告知,谢谢
(3)关于修改 devicemapper 引擎的相关参数(最大的坑)
当你的 docker 镜像过大时,比如大于 10G,那么默认的 devicemapper 引擎是会报错的,因为 docker service 初始化的时候,默认分配的存储空间最大也就是 10G,所以必须要修改这个参数,并重启 docker service。关于修改这个参数,足足搞了一天,差点都放弃了,因为按照网上的资料所有的更改都无法生效,具体方法如下:
第一种方法为 service docker start 之前修改,其修改的内容就是增加--storage-opt dm.basesize=30G 选项;第二种方法为调用脚本动态增加,具体的操作方法可以参照如下:http://blog.chinaunix.net/uid-20788636-id-5029770.html。
先说第二种方法,在运行脚本的过程中,出现以下的错误:resize2fs: Device or resource busy while trying to open /dev/mapper/docker-253:1-1270544-d2d2cef71c86910467c1afdeb79c1a008552f3f9ef9507bb1e04d77f2ad5eac4。因为此脚本主要是调用 resize2f 函数来进行动态的扩存,但是由于 centos6 文件格式的为 xfs,对比并不支持,所以此方法行不通。对于 centos6 来说,还可以统统 xfs_growfs 来进行扩存,但是对比并不熟悉,研究了一些时间,感觉也没有什么头绪,暂时放弃了。关于 resize2f 调整 rootfs 可以参照http://www.111cn.net/sys/linux/87656.htm
但是对于第一种方法,也是会报错,报错的信息如下:Error starting daemon: error initializing graphdriver: Unknown option dm.basesize。所以两种方法现在都无法达到本来预期的目的,当做一些事情的时候,忽然感觉所有的事情都在阻碍你向前进,这个时候应该静下心,努力排查可能出现的错误,找出其中的蛛丝马迹,应该相信你并非是第一个碰到这个题目的人,合理的利用 google。经过很久的排查,终于在 github 的一个 issue 里面找到了可能存在的问题,该网页如下:https://github.com/docker/docker/issues/21171。其中的一位同学做了一下的事情:
再指定 storage-opt 的时候,同时也指定了 storage-driver。抱着试一试的心态,添加了上述参数,果然可以成功的改变 container 中 rootfs 中的大小,算做经验教训吧。其他有用的选项可参考如下示例:DOCKER_STORAGE_OPTIONS="--storage-opt dm.loopdatasize=2000G --storage-opt dm.loopmetadatasize=10G --storage-opt dm.fs=ext4 --storage-opt dm.basesize=20G"
dm.loopdatasize=2000G 是指存放数据的数据库空间为 2t,默认是 100g
dm.loopmetadatasize=10G 是存放 Metadata 数据空间为 10g,默认是 2g
dm.fs=ext4 是指容器磁盘分区为 ext4
dm.basesize=20G 是指容器根分区默认为 20g,默认是 10g
(4)关于 docker 镜像拉取以及 squid 代理
现在很多公司的机子都是内网环境,无法连接外网,无法连接外网也就无法从 docker 的 registry 中拉取镜像,除非你们公司搭建了私有的 registry 并且包含你所需要的镜像。如果没有,那么有两种途经来解决:
第一种方法,就是先在可访问外网的机子上(一般个人本机可以访问外网)下载所需要的 docker 镜像,然后通过 docker save 命令将其保存为本地镜像,然后导出后再通过 docker load 命令将其导入到所需要的 docker 宿主机中。这种方法比较麻烦,但是好在一般都能实现,对于确实无法连接外网的宿主机也不失为一种办法。
第二种办法,就是在内网中找一台可以访问外网的机子,然后在该机子上搭建 squid 代理服务器,docker 的宿主机可以通过配置代理来拉取镜像。关于 squlid 代理服务器运行可以参照一下命令:
docker run --name squid -d --restart=always \
--publish 3128:3128 \
--volume /search/wangyukun/log/cache:/var/spool/squid3 \
--volume /search/wangyukun/log/squid_log/:/var/log/squid3 \
sameersbn/squid:3.3.8-19
当然前提是你已经通过第一种方法安装了 squid 镜像,这属于一次辛苦多次收益,哈哈,如果你们内网的所有自己都无法连接外网,那么只能通过第一种方法了。启动 squid 代理服务后,那么就要 docker 宿主机上配置代理服务,以 centos6 举例,修改/etc/sysconfig/docker 配置文件的内容如下:
other_args="--graph=/search/odin/wangyukun/docker --insecure-registry 10.142.97.235:5000 --storage-driver devicemapper --storage-opt dm.basesize=100G --storage-opt dm.loopdatasize=2000G --storage-opt dm.loopmetadatasize=10G"
HTTP_PROXY=http://your_squid_service_ip:3128
http_proxy=$HTTP_PROXY
HTTPS_PROXY=$HTTP_PROXY
https_proxy=$HTTP_PROXY
export HTTP_PROXY HTTPS_PROXY http_proxy https_proxy
这样重启 docker service 就可以了。镜像搭建以及走过的坑就先说到这吧,剩下的部分第二篇再续。。。