Fun_Fox · 回帖 · 测试之家

会员

Fun_Fox

第 92982 位会员 / 2024-07-03

29 篇帖子 • 61 条回帖

13 关注者

1 正在关注

0 收藏

简单的开始，用心的内容

未设置 GitHub 信息.

怎么系统性的学习 AI，从哪里入手呢 at 2025年12月18日

https://docs.swanlab.cn/examples/robot/lerobot-guide.html
怎么系统性的学习 AI，从哪里入手呢 at 2025年12月18日

https://github.com/jingyaogong/minimind 看看这个
很好奇有老哥从测试转行的吗 at 2025年09月18日

我说的不是测试方向、也不是辅助方向的，是公司主业务此产品方向的。
很好奇有老哥从测试转行的吗 at 2025年09月17日

哪有为什么？开发都没工作，测试更不用说了。我用之前的积累，目前在干 Agent 开发的工作。
咱们论坛测试最大年纪，还在测试行业的是多少岁呀，很好奇 at 2025年08月28日

我 36，在上家公司，团队里面我年龄最小
将业务自动化脚本，尽可能都转为 MCP at 2025年08月19日

不只是 api，数据，Ai 操作其他系统的对接。rpa 等等。
将业务自动化脚本，尽可能都转为 MCP at 2025年08月19日

可以在墨搭社区上，先做一个 local 类型的 mcp，目前这部分跟猜测是领域重合度很高，掌握后不管是从效率，还是未来职业方向可能会是一个好的方向
【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at 2025年04月30日
这个事情，之前我也想过，
1. 使用能够理解现实世界的模型：
GPT4o 听说对现实世界的理解以及定位精度很高

2.自己搞模型：
- 使用过 yolo 屏幕目标检测，我看到过有人用这个给王者荣耀的 hero 标注。实现游戏对战 https://kezhi.tech/86b4b2c0.html
- 但我更推荐《基于 Transformer 的目标检测之 DETR》https://zhuanlan.zhihu.com/p/387102036 这个技术更新。目前 yolo、还是 detr 我还没时间去尝试，标注的性能还没测试过
【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at 2025年04月21日

或者就使用方案一：依赖于 xml 层次结构
【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at 2025年04月21日

请看测试的模型，建议使用 32b，测试下来很准
【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at 2025年04月11日
1. 减少视觉模型调用的次数
2. 加快二次响应
白话讲，第一次遇到的问题（问大模型），第二次就不用再问了
【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at 2025年04月08日

再重新拉去一下代码已经增加 WEB 页面版本了
【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at 2025年04月08日

OK，后面考虑用 gradio 加一个体验测试页面
【迭代 4】基于视觉模型的 APP 自动化异常诊断中心 at 2025年04月07日
【迭代 3】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月31日

如果你的本地知识库已经有，应该可以通过 api 进行调用。
这里我推荐另外一个 python 库（rankify），建议自己实现 RAG，方便对技术的理解。你可以看下这个微信推文
【迭代 3】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月27日

欢迎各位提出新的见解:
【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月26日
- API 是 deepseek 的 vl 模型，硅基流动平台的很便宜
- 非点击区域至灰，很简单 Opencv 实现即可
【迭代 2】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月25日
我 review 了一下代码
- IO 操作还是有些频繁，我减少一下
- 另外图片保存我放到线程池中操作
- 另外 xml 解析我查查是否有另外一些高性能包
- bouds 边界信息数据保存，我再琢磨一下
【迭代 2】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月24日

我后面琢磨一下，怎么优化。
【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月17日

纯视觉的可以研究看一下这个例子
https://github.com/X-PLUG/MobileAgent/blob/main/README_zh.md
【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月17日

在自动化脚本执行失败，大模型介入进行 “诊断”。
【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月17日

解决弹窗，还有一种使用 OCR 的方式，但实现逻辑比较复杂。
【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月17日

大佬，受教了，后面研究一下
【迭代 1】基于视觉模型的 APP 自动化异常诊断中心 at 2025年03月14日

嗯，这种尝试过的，给大模型手机分辨率后，让模型返回按钮坐标。
这种对模型的能力要求有些高。之前尝试过，返回的坐标容易不正确。
但可以看一下 mobile_agent 这部分代码，是阿里视觉模型的，没有依赖页面结构
最近的 OMniparser 大家看了吗？(ai 自动化新纪元） at 2025年02月21日

https://www.aivi.fyi/llms/deploy-omniparser2.0