数据测试各位大神，请问从各大网站抓取业务需要的新闻资讯，然后根据算法对抓取的资讯打上标记，这种数据的测试除了人工抽样，还有什么方法吗？

莫叫姐姐 · 2022年03月07日 · 最后由莫叫姐姐回复于 2022年03月08日 · 5999 次阅读

我们公司目前从各大金融网站抓取各板块的股票资讯
然后通过算法给资讯打上对应的标签
为了之后进行之后的个性化推荐

标签的分类模型已经确定

需要测试的内容有：
1.检查抓取到的资讯，通过算法，打上的标签是否正确
2.根据推荐策略，测试给用户推荐资讯的准确度

请问针对以上两个测试点，需要怎么开展测试呢？

共收到 11 条回复时间点赞

Thirty-Thirty #1 · 2022年03月07日

先手工测着，等产品稳定了，再考虑自动化

莫叫姐姐 #2 · 2022年03月07日 Author

对

Thirty-Thirty 回复

我就是不知道如何进行自动化测试，因为数据都是没有规律性的，也不知道具体的正确答案应该是什么，怎么去做校验

国文 #3 · 2022年03月07日

这种怎么感觉是标注团队干的事情啊！

magicyang #4 · 2022年03月07日

正确的定义是什么？需要自己造独立于训练集的完整验证集？定期跟新最新的数据？
准确度的衡量指标是什么？点击率？收益率？能不能转化成用户行为，在操作中埋点判断?
测试还能参与一些，2.貌似不需要测试参与什么吧。产品自己跟指标不就好了。

Thirty-Thirty #5 · 2022年03月07日

对

莫叫姐姐回复

看来手工测试还没做到足够好，先搞定手工吧

莫叫姐姐 #6 · 2022年03月07日 Author

对

magicyang 回复

1.其实给抓取的内容打上对应的标签，就是根据抓取内容中的关键字，有关键字的就打上此关键字对应的标签，那是不是可以自己创造一些假数据验证标签能否打上？
2.根据推荐策略给用户推资讯，如果符合用户逻辑的话，按照你说的点击率、收益率应该是会提高，但是提高到多少就不知道怎么衡量

陈恒捷 #7 · 2022年03月07日 1 个赞

对

莫叫姐姐回复

你这个业务其实和普通用户业务还有点区别，特征是：没有办法给出明确的预期结果。

1.检查抓取到的资讯，通过算法，打上的标签是否正确

这种地方用到的算法，有可能是通过机器学习训练得到的算法模型。这类模型是否准确，专业点说叫 “会不会存在过拟合” ，即会不会对训练的数据吻合度很高，但对新数据吻合度很低。这类算法要测试是否准确，个人理解的标准姿势应该是不断扩充更新训练集、测试集、验证集三个数据集合，保障训练出来的模型在后两个集合下一直保持好的表现。

当然简单点，也可以抽样检查下算法模型得出的标签，和你理解的（或者更好是找提这个标签需求的产品来看）是否一致，如果不一致比较多，可以反馈，要求进行优化。

如果像你说的，只是检测关键字是否匹配，匹配就打标签，那就做个单测甚至直接 review 代码，看关键字和标签的映射关系对不对就可以了。

2.根据推荐策略，测试给用户推荐资讯的准确度

这个和前者类似，准确度这玩意没有标准的衡量方式。一般最简单也最容易让人信服的，就是点击率、转化率这些相比没有推荐有没有提升（可以做 AB 测试，这样最明显）。而这块其实测试没什么能做的，最多就是自己做个小的接口测试，每次策略有更新时验证下对于接口测试里提供的咨询数据，推荐策略得出的结论是否基本一致。准确率要提升，背后更多是产品和算法工程师根据用户转化率情况，持续沟通优化。

magicyang #8 · 2022年03月08日

对

莫叫姐姐回复

你需要理解算法的逻辑，产品的逻辑，不按逻辑造出来的数据只能给别人添堵。同时最好是线上的真实数据更有说服力，怎么筛选数据是你需要考虑的。从行文看，你大概不懂什么叫训练集和验证集，如果做算法相关测试，请补算法。
客户行为可以通过 APP 或者页面的点击事件来跟踪，交易可以根据后台逻辑来跟踪。从行文看，你不知道如何去做。这是需要前端、后端、产品配合做的事情，测试能做的很少。

如果你是小兵，去求助你的 LEADER 吧。
如果你是 LEADER，那你自己需要 PUSH 下自己了。