灌水 用 java 弄了个爬虫玩儿,竟发现...

lyu · 2016年04月29日 · 最后由 思寒_seveniruby 回复于 2016年04月29日 · 27 次阅读

写了个爬虫爬 testerHome 的所有页面出现的某几个关键词的频率。目前还没爬完,7000 多个页面的结果告诉我们,TesterHome 就是一个移动招聘社区!

共收到 7 条回复 时间 点赞

I love you jet, you are the greateeeeeeest man! Super star!

@topics I totally agree with you my dude. I love him so much too!

appium robotium 这个词都没入榜...总感觉哪儿不对.

确认爬虫写的没问题吗 (;′⌒`)

lyu #5 · 2016年04月29日 Author

#3 楼 @seveniruby 我没有添加! 我预计如果 appium 和 robotium 加进来也无法扭曲这个结果,哈哈哈 。 话说还可以有哪些关键词,可以加进来,下次彻底趴一趴我们都在做些什么

lyu #6 · 2016年04月29日 Author

#4 楼 @gaopeng1106 不止爬的 topics, 所有页面都 fetch. 等我完善了代码贴出来给您评估评估

#5 楼 @jet 应该是先分词再统计关键词的排名. 然后取我们首页的每个版块的名字. 你通过接口跑的全吗, 爬完了吗

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册