转转QA 浅谈 IM 与相关测试方法

笑哼 for 转转QA · February 22, 2019 · 1876 hits

作者|赵里京

背景

目前转转的所有业务都在快速增长,支撑其用户服务的客服系统也同样在快速发展,以承接用户每天大量的问题。
最开始转转的客服系统体系如IM,工单以及机器人等都是使用第三方的产品。但第三方产品对于转转的业务,以及客服的效率等都产生了诸多限制,所以我们决定自研替换第三方系统。下面主要说一下IM系统以及相关测试方法,先来了解一下IM系统和WebSocket。

WebSocket?

WebSocket是HTML5出的一种在单个TCP连接上进行全双工(通信允许数据在两个方向上同时传输)的通信协议。

  • WebSocket与http协议区别:简单的说跟HTTP协议基本没有关系,WebSocket只基于HTTP,或者说借用了HTTP的协议来完成握手动作。
  • WebSocket与Socket区别:WebSocket是应用层协议,Socket是传输控制层协议,即WebSocket建立了Socket连接。下图可直接说明两者区别。 IM系统常用的实现方案:
  • http短轮询:循环发送request请求,有没有新消息都会发送
  • http长轮询:Client端发送request请求,server端收到后保持住此次请求x秒,x秒过程中有消息立刻返回。没有新消息就等待x秒,x秒后放开请求,Client端再发送请求, 不断反复
  • WebSocket长连接:Client端发送http请求,http请求会比普通的http请求多出信息如下图,这个就是Websocket的核心了,告诉Nginx注意啦我发起的是Websocket协议。与Server端建立握手成功后连接建立并在不触发onClose事件情况下不会断开


那么哪一种方案更加合适呢?短轮询与长轮询有以下几个缺点:

  • 实时性差
  • 每一次请求都需要进行用户身份验证。
  • 流量开销大,每一次请求都会携带header,但业务上header里面大部分的信息都是多余的,这样就产生了数据的冗余。 而WebSocket不存在以上几个问题,身份验证只进行一次。传输信息完全由业务方自定义,不会有冗余。当然WebSocket也有自身的问题,应用置后台、终止进程、手机重启、4g转wifi、断网等都会中断连接。所以WebSocket方案在实时性以及稳定性上更加合适IM,我们也选择的是WebSocket。

项目整体测试过程

先从一张图看看我们在项目中的整体测试过程

  1. 前置测试阶段 所谓“前置测试阶段”就是在开发的过程中进行的测试。首先在需求评审完成后,我们基于WebSocket开发了UserWebSocketClient和KefuWebSocketClient两个WSClient实例,分别模拟用户端和客服端。实现功能有:用户与客服登录,相互发送包括纯文本、表情、图片、商品和订单消息,会话转移,坐席状态转换,用户排队等,基于这两个测试实例来不断的测试调试开发的版本。 WSClient有4个主要事件:onOpen、onMessage、onClose和onError,首先是WSClient发送onOpen事件与服务器握手建立连接,成功后发送心跳消息保持连接。同时触发onMessage事件,onMessage开始监听服务端发来的信息,我们可以在onMessage中进行需求实现。onOpen、onMessage为异步操作。以上代码是由一个线程来执行,所以可以对以上代码进行多线程操作。
  2. 功能测试阶段 也就是正式的测试阶段,这一阶段除业务需求功能外,有IM系统自身的特性,需要我们重点关注以下几点:
    • 消息实时性
    • 消息可靠性
    • 消息断线重连
    • 容灾容错
    • 系统的安全性
    • 系统性能

实时性:
发送端发送消息,接收端能立刻收到。测试手段,在程序的onMessage中加入如下逻辑long t1=System.currentTimeMillis();long t2=System.currentTimeMillis();System.out.println(t2-t1);分别获取发送端,接收端发出和接收信息的时间戳,差值即为延迟时间。还可以给Server端施加压力的情况下计算这个时间会更加贴近线上的实际场景。
可靠性:
所谓可靠性是指发送消息不丢失,异常提示准确等;如发送和接收方的消息数量与内容准确,并在网络异常的情况下有保障机制,保证发送的消息在网络恢复后,能够正常的发送到接收方。可在WSClinet的onMessage中循环发送大量消息,另一端进行统计,测试数据一致性。
异常提示准确,如网络情况的断网恢复提示,发送失败提示,已读未读提示等相关提示信息,能够保证用户清晰了解系统状态。
断线重连:
WebSocket对于应用置后台、终止进程、手机重启、4g与wifi互转、断网等都会中断连接,并且这些场景在实际使用中会经常发生。所以要对这些场景进行模拟。在这些场景下,IM系统自身保证一个合理的功能。
容灾容错:
多集群场景,在其中一个服务停止运行后还可以保证会话重连。
安全性:
跨脚本站点攻击,用户可以发送任何文本内容,所以一定要做的就是跨站点脚本攻击的测试。发送消息到任意用户,即修改目标id。验证会话的身份校验。
系统性能:
WS在性能方面很重要的一点是在服务器上最大能支持的连接数量,最后会简单介绍一下使用jmeter如何进行ws建立连接的性能测试。

3.线上监控阶段
上线后我们使用puppeteer对线上进行ui自动化功能监控,监控主要有3个方面内容:
(1) 监控主流程的ui用例
主要包括的场景:用户客服登录IM、机器人问题校验、用户与机器人互动、用户申请人工客服、排队、建立会话、消息发送回复最后关闭会话等。
(2) 监控平台
如果上面的用例执行失败,产生了快照,我们会将失败信息与快照上传到监控平台。可对错误记录进行查看和编辑。如图


目前平台功能简单,后期也会不断增加功能,如用例管理,监控频率设定,手动触发用例等等。
(3)上线自动触发ui用例
对应的集群上线完毕后,会通过mq消息推送到监听服务,监听服务收到后会自动触发用例执行,回归线上功能,并返回结果。

WebSocket性能测试

最后,我们来简单介绍一下如何使用Jmeter进行WebSocket的性能测试。首先是Jmeter环境搭建和脚本配置,需要下载jar包

  1. Jmeter (已有就不用了)
  2. websocket请求模板 JMeterWebSocketSamplers
  3. jetty-http
  4. jetty-io
  5. jetty-util 6.websocket-api 7.websocket-client 8.websocket-common 将2~4中下载的jar包放到Jmeter以下目录下,就能够被调用了。再将你下载的所有jar包,复制到 apache-jmeter-4.0\lib\ext下(apache3也可以)。 先在测试计划中添加线程组,然后右键添Sampler时就能看到websocket的模板,常用的就是websocket request-response Sampler(连接+发送data或者只发data)


如果需要用户认证,再加上用户的信息http信息头管理器,进行用户认证,连接和发送接收消息的基本配置搞定。就可以对server端进行websocket的连接和发送消息的压力测试了,非常简单。

No Reply at the moment.
需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up