公司在做数据分析的平台,简单来说就是通过 sdk 收集 app 或者 web 端用户的使用数据,然后通过 kafka、SparkStreaming、hdfs 及 Impala 来做各个维度指标的准实时数据分析,数据验证方面的测试实在不胜其烦,数据量巨大而且不同于普通的离线数据分析,对应查询条件的组合又是无法穷尽枚举的,坛子里有没有类似经验的大神出来交流一下的。


↙↙↙阅读原文可查看相关链接,并与作者交流