此文章来源于项目官方公众号:“AirtestProject”
版权声明:允许转载,但转载必须保留原链接;请勿用作商业或者非法用途
今天我们聊一聊 集群建设 这个话题。近几年,不论是为了提高公司内部的测试效率,还是因为疫情带来了更多远程办公的场景,越来越多的企业都想要搭建自己的设备集群。
但搭建设备集群,真的是搭几个设备柜子这么简单的问题吗?在集群建设过程中,我们需要考虑哪些问题,会面临怎样的困难?
我们将以 网易的集群解决方案 为例,从机柜硬件和软件平台 2 方面,来探讨下这个问题。
不一样的使用场景、不一样的设备类型、不一样的设备规模,都会影响到机柜的最终形态。比如以使用场景来说,我们就设计有便携式手提机柜、中大型机柜:
图 - 便携式手提机柜
便携式手提机柜,可以像拎手提箱一样,拎到哪里,测到哪里;所以更适用于一些 测试效果演示场景、户外环境测试场景 等,甚至直接放在工位上测试也是一个非常不错的选择,缺点是设备容量有限,只能容纳 10 台设备。
图 - 组合型中大型机柜
而中大型机柜,更适用于放置在公司机房里面,因为它能容纳更大的设备规模,比如我们常见的 4 * 8(32 机位)、8 * 10(80 机位)规格,甚至组合多台中大型机柜,实现更庞大的设备集群。
再比如以设备类型来说,会存在手机机柜、平板机柜、PC 机柜等等:
图-iOS 手机机柜
图-PC 机柜
所以尽管都是设备机柜,但它们可以有非常丰富的形态。
那对于承载设备的机柜来说,除了必要的电、网设施,更重要的还是保障设备稳定运行以及对它的实时监控。
比如 散热 。可以想象一下,当一个机柜内,几十台甚至上百台设备同时运行,将产生多大的热量,如果机柜没有很好的散热措施,如何能保障设备的安全和稳定运行?
从机柜的材质选择,到机柜内置的风扇设置,到机柜各面的打孔面积,都是我们要考虑的细节。
另外就是 异常监控 ,大部分时间,机柜都处于无人值守的情况下,设置必要的异常数据监控,能及时将异常反馈给管理员,以便他们迅速做出响应,尽量避免不必要的事故发生。
机柜不仅仅是我们表面看到的一个铁架子,它内部仍需要很多配件,协同工作,才能实现设备通网通电、转发设备信息、控制设备、监控设备等工作。
比如 数据线、PDU、集线器、工控机 等等。配件的选择,会影响到整个系统的稳定使用,我们内部在迭代机柜配件的时候,就踩过很多坑。
比如数据线无法识别部分特殊的平板设备、比如集线器会出现部分接口坏掉不能跟设备进行数据通讯的情况等等。
所以选择一款稳定好用的配件,也是一个 需要长期的选型和测试的过程 。
当然,除了直接在市面上进行配件选型之外,我们还可能在机柜迭代的过程中,对配件进行定制,比如我们为了实现程控设备通电、程控设备数据通断,而定制的 智能控电版本的集线器 :
图 - 智能控电 hub 的工作演示
硬件基础有了以后,我们的集群建设工作才完成了一半而已,接下来需要搭建一个设备管理系统,来 查看、管理和使用机柜上面的设备资源 。
我们需要考虑的是,这个设备管理系统,会有哪几类的人员在使用,也就是我们说的角色,每个角色需要做的事情包含哪些(系统应该提供的功能),角色的权限范围又是怎样的。
比如 设备管理员 ,他要做的事情,可能就是查看机柜设备的在线情况,对机柜设备进行一些日常维护,给各个项目组合理分配机柜上的设备资源等等:
图-DeviceKeeper 设备状态页面
图-DeviceKeeper 日常维护页面
那普通用户的话,可能就是查看有哪些可用设备、远程连接设备进行一些操作或者调试等等:
图-DeviceKeeper 云真机页面
还有就是系统管理员,他可能需要进行一些用户管理、项目管理和机柜管理等事宜,甚至可能需要导出设备或者系统的使用统计报告:
图-DeviceKeeper 系统管理页面
图-DeviceKeeper 使用统计页面
所以说,集群建设,并不是一朝一夕就可以完成的事情。它需要企业投入大量的时间和人力成本,去设计机柜硬件和管理系统。
企业在决定搭建自己内部的设备集群时,就需要考虑好自己的集群需要兼容哪些平台的设备、集群规模大小如何,是自己投入大量的时间和人力成本去实现一套,还是对外采购现有的一些集群解决方案,这都是企业在集群建设前期,需要去考量和调研的内容。
Airtest 官网:https://airtest.netease.com/
Airtest 教程官网:https://airtest.doc.io.netease.com/
搭建企业私有云服务:https://airlab.163.com/b2b
官方答疑 Q 群:117973773
呀~这么认真都看到这里啦,帮忙点击左下角的爱心,给我点个赞支持一下把,灰常感谢~