问答 如何造一千万条身份证号码的数据?

reviewtiger · 2018年04月19日 · 最后由 junnyjiang 回复于 2018年04月23日 · 2552 次阅读

如何造一千万条身份证号码的数据?给出设计思路😅

共收到 18 条回复 时间 点赞

想一下身份证组成结构,前面几位是跟出生地有关百度应该查得到,中间是出生日期,后面好像是随机 4 位数字
剩下的就是循环了

http://sfz.uzuzuz.com 把这个里面你想生成的 1000 的身份证号拿出来来,写个自动化脚本

正式环境测试环境?进行真实性验证么?只验证长度么?需要考虑 15 位的么?需要考虑带 x 的么?弄一个,重复 1 千万次可以么?
造出来我存哪? 要多长时间造完?还想知道答案么?

我给你分享一个吧,包括手机号码、身份证、中文名。当然,规则是符合的,但是联网核查肯定是不过的。
perl 版本:https://share.weiyun.com/5JfemTs
python 版本:https://share.weiyun.com/5urq7eG

需要多少改下前面变量的值,然后重定向到文件中。

为啥有说是 1 千?人家是要 1 千万啊。1 千万时间和存哪,有限制吗?

chen 回复

时间暂时没有,存数据库里

喂 110 吗

我需要 1000W 条有效身份证信息
好的你稍等,请留下你的地址

一首铁窗泪留给自己

皆非 回复

😂 😂 😂

Ikaros灬 回复

最后一位是 校检码,需要算法根据前面 17 位计算的。

reviewtiger 回复

我是用 python 写了一份生成有规则,联网查询有效的身份证号码 但是每次生词一次 要不循环生成 10000000000000?

匿名 #11 · 2018年04月19日

同楼上,我之前写过随机生成一个的,要不楼主循环个 1KW 次 😂

😂 虽然能解决问题,但是不是有点傻瓜式的做法呢

皆非 回复

emmmmm。。。实在不行只能这样循环了

匿名 #14 · 2018年04月19日
reviewtiger 回复

如果要那种真实的能审核通过的,可能一下子想不到什么好方法😢

网上有泄露的数据

皆非 回复

涨姿势了😂

要用多线程和多机器加速生成,不要每一个都 I/O 去 insert 数据,一批批 insert 相对减少 I/O。要骚一点可以用 redis 控制具体的生成量,不过其实没啥用纯骚而已😂 😂 😂

昨天刚好有看类似的东西,github 上找了个项目,100w 大概几十秒,千万级好像有点难产。传送门:--》https://github.com/wangrain/IdAnalysis.git

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册