新手区 请大神指点一下。爬虫测试怎么做!?

大包 · 2017年02月14日 · 最后由 梦梦GO 回复于 2021年04月01日 · 2514 次阅读

请大神指点一下。爬虫测试怎么做!?

共收到 4 条回复 时间 点赞

最近也刚开始接触爬虫测试,开发写好爬虫脚本让我来测试验证,我这边的验证方法主要有两点:一是,运行爬虫脚本观察是否会出现异常,这点主要是通过查看 log 日志来检查的;二是,检查爬取的数据对不对,这点主要是查看数据库里的数据字段是不是全,是否都有值;

#1 楼 @yhui 谢谢你的回复。我现在主要是对爬虫的数据检查,看下爬回来的数据是否符合要求,请问对日志的检查主要是查什么内容?查有没有异常还是其它!

请大神指导怎么测试爬虫

最近我也赶上了爬虫测试,上线前主要做了以下几个步骤:
1、会要求代码 rebview, 然后自己也会在发布前去瞄一下代码,大致判断下逻辑是否有误。主要是之前检测时候发现一些数据的错误,就养成了这个习惯
2、检测爬虫数据是否有爬回来,以及数据准确性。--这里增加一句,我们要求爬虫不做逻辑计算,保留全部数据,数据筛选计算等在另一个对接系统处理
3、根据各种设定场景,验证爬虫数据是否正常
4、数据入库的验证
上线后,会对线上数据做追踪:
自己去写一些二次验证的脚本,对线上为空或者明显异常的数据,去验证漏抓比率,以及数据准确性等。这一步总觉得二次验证的行为很傻,但是暂时也没想到好的方案,难受

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册