项目背景介绍:
广告推荐系统,通过用户的交易数据给用户打上特有的消费标签,后根据用户标签进行广告推荐

AI 模型分析:
监督学习分类问题,每个标签是二分类问题。
e.g. 标签 car 可以分为有车和情况未知两种

方法选择和评估指标:
混淆矩阵,通过精确率,召回率评估模型泛化能力

测试集选定:
测试集按均匀分布随机数生成(所有 openid 按均匀分布随机)700 个样本

样本标注:
获取测试样本真实信息(由于无法寻到用户该方法不适用于样本标注)
根据样本的交易信息进行人工标注。人工标注存在认知差异,需达成人工标注的基本共识,进行多人独立标注。

数据统计分析


↙↙↙阅读原文可查看相关链接,并与作者交流