测试之家
  • Topics
  • QA
  • 招聘
  • 社区学堂新
  • 开源项目
  • 活动
  • Wiki
  • Sign Up
  • Sign In
会员
Fun_Fox
第 92982 位Users / 2024-07-03
21 篇帖子 • 54 条回帖
13 关注者
1 正在关注
0 收藏
简单的开始,用心的内容
未设置 GitHub 信息.
  • 个人信息
  • 专栏
  • 话题
  • 回帖
  • 收藏
  • 关注中
  • 关注者
  • 【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at April 30, 2025

    这个事情,之前我也想过,

    1. 使用能够理解现实世界的模型:

    GPT4o 听说对现实世界的理解以及定位精度很高

    2.自己搞模型:

    • 使用过 yolo 屏幕目标检测,我看到过有人用这个给王者荣耀的 hero 标注。实现游戏对战 https://kezhi.tech/86b4b2c0.html
    • 但我更推荐《基于 Transformer 的目标检测之 DETR》https://zhuanlan.zhihu.com/p/387102036 这个技术更新。目前 yolo、还是 detr 我还没时间去尝试,标注的性能还没测试过
  • 【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at April 21, 2025

    或者就使用方案一:依赖于 xml 层次结构

  • 【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at April 21, 2025


    请看测试的模型,建议使用 32b,测试下来很准

  • 【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at April 11, 2025
    1. 减少视觉模型调用的次数
    2. 加快二次响应

    白话讲,第一次遇到的问题(问大模型),第二次就不用再问了

  • 【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at April 08, 2025

    再重新拉去一下代码已经增加 WEB 页面版本了

  • 【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at April 08, 2025

    OK,后面考虑用 gradio 加一个体验测试页面

  • 【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at April 07, 2025

    🐴

  • 【迭代 3】基于视觉模型的 APP 自动化异常诊断中心 at March 31, 2025

    如果你的本地知识库已经有,应该可以通过 api 进行调用。
    这里我推荐另外一个 python 库(rankify),建议自己实现 RAG,方便对技术的理解。你可以看下这个微信推文

  • 【迭代 3】基于视觉模型的 APP 自动化异常诊断中心 at March 27, 2025

    欢迎各位提出新的见解:🍠

  • 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at March 26, 2025
    • API 是 deepseek 的 vl 模型,硅基流动平台的很便宜
    • 非点击区域至灰,很简单 Opencv 实现即可
  • 【迭代 2】基于视觉模型的 APP 自动化异常诊断中心 at March 25, 2025

    我 review 了一下代码

    • IO 操作还是有些频繁,我减少一下
    • 另外图片保存我放到线程池中操作
    • 另外 xml 解析我查查是否有另外一些高性能包
    • bouds 边界信息数据保存,我再琢磨一下
  • 【迭代 2】基于视觉模型的 APP 自动化异常诊断中心 at March 24, 2025

    我后面琢磨一下,怎么优化。

  • 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at March 17, 2025

    纯视觉的可以研究看一下这个例子
    https://github.com/X-PLUG/MobileAgent/blob/main/README_zh.md

  • 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at March 17, 2025

    在自动化脚本执行失败,大模型介入进行 “诊断”。

  • 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at March 17, 2025

    解决弹窗,还有一种使用 OCR 的方式,但实现逻辑比较复杂。

  • 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at March 17, 2025

    大佬,受教了,后面研究一下

  • 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at March 14, 2025

    嗯,这种尝试过的,给大模型手机分辨率后,让模型返回按钮坐标。
    这种对模型的能力要求有些高。之前尝试过,返回的坐标容易不正确。
    但可以看一下 mobile_agent 这部分代码,是阿里视觉模型的,没有依赖页面结构

  • 最近的 OMniparser 大家看了吗?(ai 自动化新纪元) at February 21, 2025

    https://www.aivi.fyi/llms/deploy-omniparser2.0

  • 周刊 # 第 1 期:手工测试:人工智能时代的无名英雄 at November 07, 2024

    周刊地址,欢迎各位 rss

  • 周刊 # 第 1 期:手工测试:人工智能时代的无名英雄 at November 07, 2024

    好的补充上了

  • 周刊 # 第 1 期:手工测试:人工智能时代的无名英雄 at November 07, 2024

    常规自顶😁 😂

  • 调研.AI 增强 PlayWright 案例及工具 ( AI Native Test) at November 05, 2024

    嗯,会越来越好的😀 😀

  • 调研.AI 增强 PlayWright 案例及工具 ( AI Native Test) at November 04, 2024

    自己顶一下😀

  • 从「百家语录」提取模型 - 指令监督微调数据集 at October 18, 2024

    全部重新更新了一下,再不行就没辙了

  • 从「百家语录」提取模型 - 指令监督微调数据集 at October 15, 2024

    我怎么看的都是正常的
    任就可能不清就看这个吧:
    https://power-filament-0e1.notion.site/11c8ae0baa5f803c9121edc4e4d15b81?pvs=4

  • 1
  • 2
  • Next
  • 关于 / 活跃用户 / 中国移动互联网测试技术大会 / 反馈 / Github / API / 帮助推广
    TesterHome社区,测试之家,由众多测试工程师组织和维护的技术社区,致力于帮助新人成长,提高测试地位,推进质量发展。Inspired by RubyChina
    友情链接 WeTest腾讯质量开放平台 / InfoQ / 掘金 / SegmentFault / 测试窝 / 百度测试吧 / IT大咖说
    简体中文 / 正體中文 / English

    ©testerhome.com 测试之家   渝ICP备2022001292号
      渝公网安备 50022202000435号    版权所有 © 重庆年云聚力信息技术有限公司