andyguo (andyguo) · 测试之家

会员

andyguo (andyguo)

第 83 位Users / 2012-12-27

香港科技大学 @ 香港

19 篇帖子 • 72 条回帖

51 关注者

22 正在关注

4 收藏

GitHub Public Repos

More on GitHub

热门话题
最近回帖

AI测试大模型稳定性测评：从理念到实现的完整技术方案

41 个赞 / 13 条回复
AI测试盘点一写 OpenAI 工具和资源，特别是 GPT 系列 - 面向开发者

21 个赞 / 1 条回复
自动驾驶今天到公司早整理一下对车路协同的一些认知

8 个赞 / 5 条回复
AI测试 Cursor 团队代码规范与开发规则

6 个赞 / 2 条回复
AI测试 AI 模型测评平台工程化实战（第一讲：从手工测试到系统化的觉醒）

6 个赞 / 7 条回复
AI测试大模型 + Search 的评估方法 - 从人工标注到第三方模型测评的系统性实践

5 个赞 / 8 条回复
自动驾驶仿真测试-HiL 测试全解析

4 个赞 / 11 条回复
AI测试深入解析 Open-AutoGLM：AI 驱动的手机 Agent 及其在移动应用测试领域的实战应用

3 个赞 / 4 条回复
AI测试豆包手机围剿战与 AutoGLM 开源：AI 手机生死局

2 个赞 / 9 条回复
AI测试最新的《Top 20 AI Prompt 编程语言》榜单

2 个赞 / 3 条回复
AI测试多裁判模型测评：提升 AI 模型评测可靠性的实战方案

2 个赞 / 0 条回复
自动驾驶无人驾驶中的 ADAS 测试的基本原理分享

2 个赞 / 0 条回复
招聘 [北京] 360 招聘测试&测试开发工程师 (15~30K)

2 个赞 / 44 条回复
AI测试全面解读大型语言模型测评：从认知演进到实操框架

1 个赞 / 1 条回复
AI测试如何解读程序和算法的区别？

1 个赞 / 0 条回复
AI测试大模型微调、RAG 和代理学习笔记

0 个赞 / 0 条回复
AI测试大模型学习第一课：深入理解 Transformer 与 LLM

0 个赞 / 0 条回复

AI 模型测评平台工程化实战（第一讲：从手工测试到系统化的觉醒） at December 30, 2025

目前还没有，这个主要是真对 lab 的 agent 开发，不是通用模型，通用模型应该简单，明年准备写一个裸模的开源
深入解析 Open-AutoGLM：AI 驱动的手机 Agent 及其在移动应用测试领域的实战应用 at December 16, 2025

是的会有，所以要描述清新，目前还在尝试中
豆包手机围剿战与 AutoGLM 开源：AI 手机生死局 at December 15, 2025

https://testerhome.com/topics/43325 可以查看这个实战效果
深入解析 Open-AutoGLM：AI 驱动的手机 Agent 及其在移动应用测试领域的实战应用 at December 15, 2025

https://live.csdn.net/v/505412?spm=1001.2014.3001.5501 测试的视频效果
豆包手机围剿战与 AutoGLM 开源：AI 手机生死局 at December 12, 2025

就是截图 ai 识别的
豆包手机围剿战与 AutoGLM 开源：AI 手机生死局 at December 12, 2025

进入人工智能阶段了，可惜发不了视频要不可以分享下给大家，不过还是有点慢
豆包手机围剿战与 AutoGLM 开源：AI 手机生死局 at December 12, 2025

是的，可以见我下一篇分享
大模型稳定性测评：从理念到实现的完整技术方案 at December 01, 2025

没个题都是 3 个模型测评，当然也可以选择一个
大模型稳定性测评：从理念到实现的完整技术方案 at December 01, 2025

90% 都是对的，我用 gpt 和 Gemini 双模型测评
大模型稳定性测评：从理念到实现的完整技术方案 at November 18, 2025

我是 3 个模型同时测评，如果 2 个都一样就默认模型评测结果是可靠的，如果不一样就需要人工审核