专栏文章 我们是如何测试人工智能的(四)补充:模型全生命周期流程与测试图

孙高飞 · 2024年01月09日 · 最后由 孙高飞 回复于 2024年01月10日 · 8793 次阅读

这些日子讲了很多东西,但比较乱,我这里补充一下完整的业务和测试流程。

生命周期流程图

根据数据闭环,我画出了上面的图,并标记了其中测试人员要参与的活动(浅蓝色)。下面我一一分析一下这些测试活动的含义。

  • 离线模型测试阶段:在模型的生命周期中,会涉及到 3 种数据。 训练集,验证集和测试集,其中训练集用来训练模型,验证集用来算法自测。 而测试人员需要自行采集/挖掘(要根据用户画像每种类别的数据都要采集到)符合场景的测试的数据。 根据测试数据对模型进行完整的评估(AUC,召回,精准等等)
  • 线上线下一致性测试: 模型的离线和在线是采取完全不同的代码进行的特征工程(模型不接受原始数据,数据需要经过特征工程后输入到模型),要保证两边的特征工程完全一致是很难的。 所以要进行一致性的测试。
  • A/B Test: 模型即便在离线进行了充分的测试,但线上的情况瞬息万变,模型上线是一个严谨的过程。 我们希望模型更新的过程更加严谨。 所以往往会让新旧模型共存一段时间。比如我们先把 10% 的流量切给新模型, 90% 的流量依然发送到老模型中。 然后待观察效果没有问题后,再切 20% 的流量到新模型上,以此类推, 直到最后新模型完全替代老模型。
  • 线上模型监控:因为用户行为瞬息万变,可能随便一个社会性时间用户的行为就发生了重大的改变。 所以我们需要实时的监控线上效果。
  • 数据质量测试:新采集的数据要加入到自学习之前,需要验证数据本身的质量。以免犹豫数据本身出现了问题导致模型效果的偏差。

最后欢迎加入我的星球,我会定期发布高质量测试技术教程。

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
共收到 2 条回复 时间 点赞

孙老师分享的都是第一手的干货,又是测试视角出发的,完美符合我的学习需求,第一时间就知识星球付费 + 买书支持了。希望孙老师能坚持分享下去

还有个问题想请教下孙老师,人工智能的业务流程,一般有哪些场景会用到您书中介绍的容器化的知识,有这方面的更详细的经验可以分享一下么?

lastsfs 回复

感谢支持~~ 回答一下问题:比如人工智能中,做计算机视觉场景下, 会用到容器化中的边缘计算能力。 因为系统需要对接很多的摄像头, 这些终端设备都是部署在边缘侧的。 还有就是模型训练和部署模型推理服务的时候, 也都是用容器化进行部署的。 现在的人工智能系统基本都是在 k8s 中部署的。

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册