通用技术 利用图像识别技术解决非原生控件的定位问题

hello · October 23, 2018 · Last by hello replied at November 09, 2018 · 4679 hits

缘起

前天同桌妹纸问一个控件怎么定位的问题,我张口就来,ID,xpath。。。。。妹纸说这些我都试过了,还是无法定位,不信我Debug给你看。N种方法尝试后,只能接受现实,非原生控件,于是老脸一红,告诉妹纸,这是非原生控件,无法通过常规方式定位。搜索了一下,很多帖子都反映过这个问题,但是都没给出解决策略。不知道这些小伙伴最终有没有解决。遂决定,吃个大闸蟹,研究一下看能否解决。

非原生控件给自动化带来的痛点

  • View里控件都定位不到
  • 控件随机变化(如支付密码键)
    密码键盘每次页面打开或者页面刷新键位都不一样

  • 常规定位方式无法识别
    智能货架,经常变换的显示位置

常规解决方式

  • 坐标大法:但是坐标大法对于有些随机变化密码键就无法操作了。
  • 开发配合:给特定的app包,解除安全键盘。这种操作无异于饮鸩止渴。

图像识别尝试

由于我们页面控件不会像验证码那么多干扰难识别,现在图形识别技术Java,Python,C++等都非常成熟。一通百度后在OpenCV 发现了matchTemplate 方法,在图片中找指定的图片。主要用的以下两种方法:

  • 使用OpenCV函数 matchTemplate 在模板块和输入图像之间寻找匹配,获得匹配结果图像
  • 使用OpenCV函数 minMaxLoc 在给定的矩阵中寻找最大和最小值(包括它们的位置).

具体实现

  1. 截取图

    1. 滑动到非原生控件,使元素可见
    2. 截取截目画面即为原图像
    3. 用画图工具打开原图像(不要人为放大或者缩小原图像),截取非原生控件的图像即为模板图像
    4. 原图像:
    5. 如下用画图工具打开,保证分别率不变下截取目标图像作为模板图像
    6. 模板图像(非原生控件图像)
  2. 取坐标

    1. 执行OpenCV函数 matchTemplate获取坐标
    2. 为方便公司同事和社区伸手党使用,直接上码 LvmamaKit代码工程Git传送门,调用LvmamaKit.find2BElementPoint4Debug会在原图像上标识出是否匹配成功
    3. 第二步成功后,调用LvmamaKit.find2BElementPoint返回Json格式坐标
    4. 回显示意图,忽略图片失真 5.返回坐标,自行计算出中心坐标 {"x":"309","y":"854","width":"105","height":"82"}
  3. 点坐标

    1. 拷贝返回的坐标,进行相对计算
    2. 点击相对坐标,完成你的自动化用例
  4. 识别密码
    1.密码键盘,1-9随机变,图像识别妥妥的搞定。 示意图

  5. 搞定收工

    1. 明天可以给妹子解决非原生控件的定位问题咯

参考资料

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
共收到 43 条回复 时间 点赞
hello Appium 是否无法定位非原生控件? 中提及了此贴 24 Oct 09:27
hello 求助-非原生控件如何测试 中提及了此贴 24 Oct 09:27
hello h5 界面元素无法定位,如何解决 中提及了此贴 24 Oct 11:15

赞,这方法很不错

hello #6 · October 24, 2018 作者
hover 回复

谢谢,希望可以给你带来一点点便利

图像识别好用,但注意模板问题,你这个我们的工具算成熟解决了。用在项目上了~

hello #8 · October 24, 2018 作者
chenyouan 回复

我刚起步,有啥坑,大神可否分享一下下

6,解决我一个问题

hello #10 · October 24, 2018 作者
watchdog 回复

😂 我的问题没解决。大神你帮我看看我另外一个帖子的问题。https://testerhome.com/topics/16510 如何快速改ios 模拟器host

hello 回复

不好意思。。搞不了。。我目前只搞android的

hello #12 · October 24, 2018 作者
watchdog 回复

没事,同样谢谢你,我也在搞安卓

如果是你例子中的 有文字 的案例,不需要这么麻烦,直接使用ocr就可以了。
我之前写了一个 adbui 的 python 库,你可以尝试一下。
https://github.com/hao1032/adbui

hello #14 · October 24, 2018 作者
tango 回复

多谢分享,我去学习一下。就是不知道java有没有同样的库包?

hello 回复

java没有,你可以看看ocr的相关方法,自己用Java实现

hello #16 · October 24, 2018 作者
tango 回复

好的,多谢分享,我研究一下

hello #17 · October 24, 2018 作者
tango 回复

疼讯的OCR确实可以,但是要访问疼讯接口识别图片上的文字,不能匹配单纯图片,应用略有限,但也是不错的选择。多谢分享。👍

hello 回复

是的,我看到你的举例都有文字,所以才说了ocr的方案,是个比较方便的选择,不需要提前准备图片。但是对于纯图片的是没法支持的。

hello 回复

我用你文章中的图片识别了一下,基本文字都是识别出来了。

hello #20 · October 25, 2018 作者
tango 回复

恩,这个OCR文字识别确定很强大。

hello #21 · October 25, 2018 作者
hello 回复

也是很好的方案,因为我们通常文字居多。纯图片的还是比较少的

很有启发,谢谢分享。

hello #23 · October 26, 2018 作者
西秀岭 回复

客气了。期待你的分享

hello 回复

个人感觉OCR的方案并不如你的好,毕竟现在腾讯OCR通用图片做的并不好。我上传了一张支付的图片,想要识别里面的数字位置。很遗憾腾讯优图OCR连数字1都没有识别出来。所以还是建议你暂时用自己的方案

hello #26 · October 30, 2018 作者
古古阁 回复

数字键盘识别不出来,有点尴尬。

hello 回复

对呀,对于咱们测试来说安全键盘的识别是一个很大的使用方面。很遗憾

hello #28 · October 30, 2018 作者
古古阁 回复

是的。变换的键盘,图片。。。比较麻烦

转一个,图像识别,文字识别都可以 https://testerhome.com/topics/16503

hello #30 · October 30, 2018 作者
Smile 回复

👍 不错,搞Python的可以研究研究

去年我弄app自动化的时候,也是用的openCV解决支付键盘键位随机分布的问题.
https://www.jianshu.com/p/5e507f105013

hello #33 · October 30, 2018 作者
yyy 回复

OpenCV大法就是好😂

直接用airtest图像识别(doge

hello #35 · October 31, 2018 作者
geons 回复

恩,底层都是调用OpenCV

hello #36 · November 01, 2018 作者
tango 回复

大佬 可以帮忙试一下,这个
能否识别么?

airtest不能用吗

hello #38 · November 01, 2018 作者
tt 回复

可以,帮看一下上图那个能否 识别出R3H8K

yyy 回复


怎么报错了呢

古古阁 回复

就是没识别到你原图的意思. 你把精确度调低一点试试, 0.85改成0.6 , 或者重新截图.

yyy 回复

请问你截图用的什么工具,我用微信截的图,要把精度调到0.3才能找到

古古阁 回复

这个我忘了..太久了...当时应该是用的qq自带的截图...
你可以试试snipaste

按键精灵手机版

我记得网易的airtest也是基于图像识别定位的,楼主调研过吗?

hello #45 · November 09, 2018 作者
simple 回复

网易airtest比较好用,不需要截图,他们的那个资料很少,关于这块的是他们的核心,找不到资料,很尴尬

hello #46 · November 09, 2018 作者
ctro15547 回复

哈哈哈,可以搞一搞,不过要是搞按键精灵的话网易airtest更好使

hello 回复

社区可以联系组织一次技术沙龙,邀请作者来答疑解惑

hello #48 · November 09, 2018 作者
simple 回复

那真是太棒了,黄易的Airtest应该不是先截屏再去找到模板图所在的坐标。非常期待他们能做点分享👍

hello 一招让 IOS 自动化化快的飞起 中提及了此贴 09 Nov 15:18
hello 2018年 度个人测开账单 中提及了此贴 25 Jan 18:37
需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up