AI测试 关于大模型测试,测试怎么保证交付模型最终符合产品需求

派大星 · 2025年03月11日 · 最后由 Pharaoh97 回复于 2025年03月12日 · 1012 次阅读

当前背景:
1、大模型全国各地(或者全球)遍地开花,各个厂区不论大厂还是小区,都蜂拥而上,号称落地了满血 deepseek R1
2、自媒体依靠大模型热度,比模型厂商更早挣到了第一桶金
3、测试行业也不甘落地,出现了很多基于大模型的精准测试、智能平台

共收到 6 条回复 时间 点赞

问题疑惑:
1、落地基于现有业务落地大模型,测试除了关注产品文档上那一点黑盒的东西,还应该做些什么?

与其说落地了大模型,不如说,对于企业本身,使用 deepseek,具有合规和当前战略性意义。就落地后的效果来说,一言难尽。就如 manus 一样(很多做的离 manus 甚远)

准确来说,应该是大模型应用的测试

回复内容未通过审核,暂不显示
回复内容未通过审核,暂不显示
回复内容未通过审核,暂不显示
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册