zhuhui132 · 测试之家

会员

zhuhui132

第 31516 位会员 / 2018-08-13

7 篇帖子 • 74 条回帖

6 关注者

29 正在关注

0 收藏

GitHub Public Repos

More on GitHub

热门话题
最近回帖

求职 8.24 百度面试记录

19 个赞 / 15 条回复
AI测试今天尝试用 AI 总结怎么测试 agent，用魔法打败魔法，抛砖引玉，更希望社区出一个完整教程，建立一个 AI 质量体系&模型评测体系

17 个赞 / 7 条回复
灌水 2 月底被裁，3 月面试进度

0 个赞 / 15 条回复
灌水现在测试都不卷质量和效率，全员卷 ai 了。。。

0 个赞 / 11 条回复
灌水 1

0 个赞 / 1 条回复
招聘百度社招 ACG 测试开发工程师

0 个赞 / 16 条回复
求职 4.21 阿里电话面试问题记录

0 个赞 / 7 条回复

京东物流招人 at 2025年12月02日

仅楼主可见
求问外包测试，跳槽正编，的规划路线 at 2025年11月28日

仅楼主可见
今天尝试用 AI 总结怎么测试 agent，用魔法打败魔法，抛砖引玉，更希望社区出一个完整教程，建立一个 AI 质量体系&模型评测体系 at 2025年11月28日

大家可以再看看阿里这个文章,一起学习： https://mp.weixin.qq.com/s/53KZsrAIGCAdF1_LZ5ORPw

今天尝试用 AI 总结怎么测试 agent，用魔法打败魔法，抛砖引玉，更希望社区出一个完整教程，建立一个 AI 质量体系&模型评测体系 at 2025年11月06日

此项目不能完成测试，应该定义个

def answer_consistency_test(agent, test_questions: List[str], repetitions: int = 3) -> Dict:
    """答案一致性测试"""
    consistency_results = {}

    for question in test_questions:
        responses = []
        for _ in range(repetitions):
            result = agent.process_message(question)
            responses.append(result["response"])

        # 计算响应间的一致性
        consistency_score = calculate_response_similarity(responses)
        consistency_results[question] = {
            "responses": responses,
            "consistency_score": consistency_score,
            "is_consistent": consistency_score > 0.8
        }

    overall_consistency = sum(
        result["consistency_score"] for result in consistency_results.values()
    ) / len(consistency_results) if consistency_results else 0

    return {
        "overall_consistency": overall_consistency,
        "question_consistency": consistency_results,
        "consistent_questions": sum(
            1 for result in consistency_results.values() if result["is_consistent"]
        ),
        "total_questions": len(test_questions)
    }

统计看看能不能解决的你的问题

今天尝试用 AI 总结怎么测试 agent，用魔法打败魔法，抛砖引玉，更希望社区出一个完整教程，建立一个 AI 质量体系&模型评测体系 at 2025年11月06日

好，后面有机会就出
测试应该怎么给开发制定标准 at 2025年07月28日

1、列问题数据，给出预期数据和预期收益
2、找 +1 沟通寻求支持，和研发老板同步，再和一线开发同步指标
3、定期复盘。
部署微服务测试环境难不难 at 2025年05月30日

让开发写操作文档，和提供 k8s yaml 文件。
求助一下现在哪家的 AI 能识别图片并且给出对应功能点的位置信息 at 2025年04月11日

感觉需要 gpu 机器才快点。。。要不要太慢了，一个图片 10s 多才解析完
删除 at 2025年03月28日

【老成点的测试不会给确定答案只会写明风险让产品自己判断是否上线】真的 6
2 月底被裁，3 月面试进度 at 2025年03月25日

仅楼主可见