Bug 曝光台 京东图书详情页数据展示 Bug 京东图书数据疑似窃取自当当

思寒_seveniruby · 2015年12月28日 · 最后由 曾先僧 回复于 2016年01月13日 · 2298 次阅读
本帖已被设为精华帖!

bug 描述

bug 解读

http://item.jd.com/1620261229.html
这得多低级的 Bug 啊.
Bug 来源猜测是他们的图书频道都是爬取的第三方网站的, 自己做不可能犯这么低级的错误.
可能以前爬取是 OK 的. 后来其他网站做了修改, 调整了样式. 然后京东的爬虫在解析 html 结构的时候就解析错了.
直接结果就是把人家的 html 也给爬取过来了.

bug 影响范围

用 Google 定位搜索下


发现受影响的范围并不大, 只是少数的商品. 猜测是京东发现过这个问题,然后进行了修复, 但是仍然漏掉了极少数的数据.

京东爬取当当数据的证据

追踪特定的关键词发现了如下有趣的东西
这是有人贴了求助帖子.

这是当当的 html 页面结构. 而当当的就没事, 这似乎表明了 京东爬取了当当 的数据

更多 bug 详情


如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
共收到 11 条回复 时间 点赞

我专门跑京东上看了下,果然有很多这样的 http://item.jd.com/1802852261.htmlhttp://item.jd.com/1470645418.html、......
人家小裤头就这么让你给扒了。。。

多谢,已反馈

默默点个赞

#2 楼 @lucasluo 你在京东啊?

#2 楼 @lucasluo 你们家老板不是说打假一天就完事吗,自己家这里这么多假货,连数据都要盗版别人的!!!!

牛 B 啊

#6 楼 @mzdfs @lucasluo 不要攻击人家. 我们只说技术的事情. 京东是家好公司. 个别产品没做好而已.

不是技术的人根本不会懂,最多算 B 类事故

专业啊,节操啊,。。。。。。

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册