• 感谢解答,受益满满,已经明确了需要加强的方向

  • 如果你想试用一下怎么部署到 Jenkins,定时跑任务
    1、你把代码上传到 gitlab 或 github,然后本地部署 Jenkins 拉取代码定时跑任务就可
    2、也可以购买云服务器,全流程自己走一遍(估计新人购买云服务器,几十元一年)
    如果你只是想应对面试,可以直接说你做过 Jenkins 定时任务,监控线上接口运行情况,此时面试官可能问你一下问题
    1、你怎么部署环境和进行 Jenkins 配置,配置策略是什么
    2、线上定时监控中,发现了哪些常见问题,遇到了什么困难
    3、线上监控的意义和作用
    4、接口用例维护的频率、项目组内用例维护的分工等
    其他,在面试中不断去总结遇到的其他问题,并完善自己的表述,你就是做过了这些内容

  • 感谢解答,目前的测试内容主要是包含几部分:
    1、产品文档的实现情况
    2、用户提问的实体识别是否准确
    3、根据实体召回数据是否正确,召回数据的性能
    4、模型生成的 prompt 数据是否正确
    5、模型返回的内容是否与 prompt 数据存在相关性
    6、模型返回内容的格式是否正确
    7、模型的用户提问及返回的敏感词校验
    8、模型返回的异常情况验证

    以上基本上都是基于黑盒模型的模型应用测试

    疑惑点
    1、相对传统测试的测试基准变得模糊不清了
    2、测试数据的来源、测试数据如何分类等

  • 准确来说,应该是大模型应用的测试

  • 与其说落地了大模型,不如说,对于企业本身,使用 deepseek,具有合规和当前战略性意义。就落地后的效果来说,一言难尽。就如 manus 一样(很多做的离 manus 甚远)

  • 问题疑惑:
    1、落地基于现有业务落地大模型,测试除了关注产品文档上那一点黑盒的东西,还应该做些什么?

  • 已婚的朋友看过来 at 2025年02月18日

    交友渠道就是扩大圈子

  • 已婚的朋友看过来 at 2025年02月18日

    问自己,找一个爱自己的,还是自己爱的

  • deepseek 让全国各行业工作者都颅内高潮,但是离真正落地结合现有业务达到智能化还有很长的路要走

  • 1、建议分类,简单单接口,不需要复杂判断的,都可以使用 yaml 等
    2、多接口或场景用例,需要复杂断言的部分,使用代码去实现
    3、使用 pom 来保证接口的复用,减少代码量;对断言进行封装实现基础断言和二次精准断言