新手区请大神指点一下。爬虫测试怎么做！？

大包 · 2017年02月14日 · 最后由梦梦GO 回复于 2021年04月01日 · 3525 次阅读

请大神指点一下。爬虫测试怎么做！？

共收到 4 条回复时间点赞

yhui #1 · 2017年02月21日

最近也刚开始接触爬虫测试，开发写好爬虫脚本让我来测试验证，我这边的验证方法主要有两点：一是，运行爬虫脚本观察是否会出现异常，这点主要是通过查看 log 日志来检查的；二是，检查爬取的数据对不对，这点主要是查看数据库里的数据字段是不是全，是否都有值；

大包 #2 · 2017年02月21日 Author

#1 楼 @yhui 谢谢你的回复。我现在主要是对爬虫的数据检查，看下爬回来的数据是否符合要求，请问对日志的检查主要是查什么内容？查有没有异常还是其它！

塔拉 #3 · 2018年10月09日

请大神指导怎么测试爬虫

梦梦GO #4 · 2021年04月01日

最近我也赶上了爬虫测试，上线前主要做了以下几个步骤：
1、会要求代码 rebview, 然后自己也会在发布前去瞄一下代码，大致判断下逻辑是否有误。主要是之前检测时候发现一些数据的错误，就养成了这个习惯
2、检测爬虫数据是否有爬回来，以及数据准确性。--这里增加一句，我们要求爬虫不做逻辑计算，保留全部数据，数据筛选计算等在另一个对接系统处理
3、根据各种设定场景，验证爬虫数据是否正常
4、数据入库的验证
上线后，会对线上数据做追踪：
自己去写一些二次验证的脚本，对线上为空或者明显异常的数据，去验证漏抓比率，以及数据准确性等。这一步总觉得二次验证的行为很傻，但是暂时也没想到好的方案，难受

需要登录後方可回應，如果你還沒有帳號按這裡注册。

新手区 请大神指点一下。爬虫测试怎么做！？

新手区 请大神指点一下。爬虫测试怎么做！？

新手区请大神指点一下。爬虫测试怎么做！？

新手区请大神指点一下。爬虫测试怎么做！？