云原生 探析 ElasticSearch Kibana 在测试工作中的实践应用 | 京东物流技术团队

京东云开发者 · 2023年09月20日 · 2958 次阅读

一. 为什么使用 ES Kibana

离线数据测试中最重要的就是数据验证,一部分需要测试 es 存储数据的正确性,另一部分就需要验证接口从 es 取值逻辑的正确性。而为了验证 es 取值逻辑的正确性,就需要用到 Kibana, 它能帮助测试同学更加快速高效的执行 es 数据的查询,大大提高测试效率。

二. 什么是 ES 和 Kibana

我们平常所说的 ELK 指的就是 Elasticsearch、Logstash 和 Kibana,这三个技术的组合是大数据领域中一个很巧妙的设计,是一种很典型的 MVC 思想,模型持久层,视图层和控制层。

Logstash 担任控制层的角色,负责搜集和过滤数据。

Elasticsearch 担任数据持久层的角色,负责储存数据,是一个实时的分布式存储、搜索、分析的引擎,适用于所有类型的数据,包括文本、数字、地理空间、结构化和非结构化数据,相较于 Mysql 来说更善于百万数据量的检索。

而我们这次讲的 Kibana 担任视图层角色,它是一个为 Logstash 和 ElasticSearch 提供的日志分析的 Web 接口。可使用它对日志进行高效的搜索、可视化、分析等各种操作,是一个开源的数据分析与可视化平台,与 Elasticsearch 搜索引擎一起使用。您可以用 Kibana 搜索、查看、交互存放在 Elasticsearch 索引中的数据,也可以使用 Kibana 以图表、表格、地图等方式展示数据,从而达到高级的数据分析与可视化的目的。

本次将介绍 Kibana 中的 Dev Tools 中 sql 查询 , Visualize(可视化数据)两个功能的使用。

三. Dev Tools 中的 sql 查询

ES 和 MYSQL 的区别:

Mysql ElasticSearch
Database index
Table Type
Row Document
Column Field
Schema Mapping
Index Everything is indexed
SQL Query DSL
SELECT * FROM ... GET http://...
UPDATE table SET... PUT http://...

在数据库中的增 insert、删 delete、改 update、查 select 操作等价于 ES 中的增 PUT/POST、删 Delete、改_update、查 GET。对于这些复杂的查询,es 使用 Query DSL 都可以实现。

POST /index111/_search
{
  "query": {
    "bool":
        {
        "must":
          [
            {"term":{"user": "张三"}},
            {"term":{"timeStamp": "2022-08-04 00:00:00"}}
          ]
        }
  }
}



但是相比较来说,我们更加熟悉 sql 语句,所以 es 也提供了 sql 语句的开发,让我们通过 sql 语句即可实现 ES 的查询。在 es 版本 6.3 之前都不支持 sql 语句的开发,如果需要使用 sql 语句来开发 es 的数据查询,那么我们需要手动的自己安装插件。

但是在 6.3 版本之后,es 自带就安装了 sql 的插件,集成在_xpack 下面,我们可以直接通过 sql 语句的方式实现 es 当中的数据查询

以下为使用 sql 语句查询的步骤:

  1. 进入 Dev Tools - Console(控制台)
POST /_xpack/sql
{

  "query": "select * from index111 "

}



  1. 输入以上语句,默认返回格式为 json

2.可以自定义返回的格式,如想返回文本格式, /_xpack/sql 后加上?format=txt

较为复杂的分类聚合计算的 sql 语句,也是支持的。

使用该功能,能够帮助测试同学较为方便快捷的查询 es 的数据,提高测试效率。

四. Visualize(可视化数据)使用

使用上面的 sql 语句,能够较快的查询到数据,但该 sql 语句无法保存,等下次验证回归该内容,查询同样数据时,还需再次输入 sql 语句,就可能出现需要重新了解查询逻辑,延长回归时间的问题。而使用 Visualize(可视化数据)可以将 es 索引内容经过聚合,通过图表等多种方式保存并显示出来,能够更加直接浏览 es 的数据,同时产品业务也可用于进行数据分析,创建数据看板。

以下为针对单个 es 索引创建可视化图表的操作步骤:

  1. 进入 Visualize-点击创建新视图

2. 选择想要以哪种图表样式显示数据

3. 选择应用的 es 索引

注意,首先需要对目标索引建立索引模式,否则在创建可视化图时会无法选择到该索引。路径:Management - Create index pattern。

4. 进入图表设置界面,设置想要的数据:Metrics 和 Buckets, Metrics 可以设置聚合

您可以使用 Elasticsearch 桶聚合 指定图表中显示哪些信息。桶聚合简单的把符合您搜索条件的文档分成不同类别,又叫做 buckets 即 x 轴。例如:数据的分类分析数据,通过使用桶聚合,您可以建立多个分类并看到每个分类下的数据汇总情况。

Metric 有多种聚合方式:Count, Sum, Top Hit, Unique Count,可按需选择。

Buckets 可设置你的数据集中将要根据什么信息进行检索。

如想看各个人的总得分,Metric 可增加一个分数,度量单位是 SUM,Buckets 增加人名,如果我们还想看各个人下其他维度的分数,可以再添加一个子分桶,在左侧下方点击 add sub buckets

5. 设置完成后,注意右上角需要选择应用的时间范围,默认为过去 15 分钟,可能就会出现无数据的情况,保存后,下次就无需使用 sql 查询,可以直接查看该表对应指标的数据了。

图表显示时,部分字段需要映射其他字段显示,或涉及到统计数据需要对表其中几个字段计算聚合处理,比如对其中两个字段求和,这时就可以使用到 Management/Index Patterns/Script fields 脚本字段来加工原字段,将原字段映射为其他数据和增加一列计算求和的脚本字段,增加图表的易读性。例如:将姓名字段转换成其他人名映射。但如果使用 script field, 需保证你的脚本的正确性,可执行性,避免因脚本问题出现的查询错误阻塞的情况。

Script field 可使用 painless 语言,具有和 groovy 那样的语法,和 Java 类似。以下为举例的字段映射脚本

def path = doc['user'].value;
String newUser;
if (path != null) {
    path =path.toString();
    if (path =='张三'){
        newUser = '张同学';
    }
    if (path=='李四'){
        newUser = '李同学';
    }
}
return org



可以看到,Visualize 桶聚合使用脚本加工字段,用户字段等就能直接映射出其他文本,方便直观。

五. 总结

以上为 ES Kibana 的 devtools sql 查询和 Visualize 的相关介绍和使用操作步骤,Kibana 还有其他的很多强大的功能,巧妙使用这些工具,能够帮助测试同学提高测试效率,帮助产品业务同学进行更高级的数据分析,希望本篇文章能够帮助大家更加了解和使用 Kibana。

作者:京东物流 江雯雯

来源:京东云开发者社区 自猿其说 Tech 转载请注明来源

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册