测试基础 AI 应用如何测试

凯丽 · 2023年05月16日 · 最后由 kirito 回复于 2023年05月23日 · 11604 次阅读

如果我的应用上面集成了一个 AI 功能，那我应该如何来测试呢？

比如：我通过 AI 集成了一个智能 summary 对话的功能，那我要怎么来测试确保这个功能就是我预期的呢？

共收到 7 条回复时间点赞

magicyang #1 · 2023年05月19日

我得理解：
AI 每个小方向都会有几个相对客观的评价指标来评价模型的好坏。
但是这些指标你想转化成没基础的人也能分析也能评价得标准，基本上都很痛苦。
你说保证你的预期，啥是你的预期呢？

西学东渐 #2 · 2023年05月20日

对标一些成熟的 AI 应用，从内容上看的话，对标 chatgpt？

差班生 #3 · 2023年05月22日

先写测试用例，把要验证点、执行步骤、预期结果都写出来。在进行输入和输出的验证。

凯丽 #4 · 2023年05月22日 Author

对

那这和普通功能测试不是完全没区别了吗

凯丽 #5 · 2023年05月22日 Author

对

感觉也是一种方法

凯丽 #6 · 2023年05月22日 Author

对

就是数据集的准备很难，训练数据集，验证数据集，测试数据集

kirito #7 · 2023年05月23日

对

这不是算法的活吗，算法的应用不太好衡量，验收标准我这都是业务方定的，能满足业务方就行了

需要登录后方可回复, 如果你还没有账号请点击这里注册。