夜深人静伸手不见五指一盏台灯下默默码字的地方 商业化广告的一些常识
背景
最近团队在测商业化广告引擎的模型和算法,发现很多广告计算学的术语,一直头疼记不住,在这边 mark 一下,方便以后查阅和记忆。。
指标
- 
AUC:工作中用来衡量广告排序好坏的指标。AUC(Area Under Curve)被定义为 ROC 曲线下与坐标轴围成的面积,由于 ROC 曲线(receiver operating characteristic curve,简称 ROC 曲线)通常介于 x=y 这条直线的上方,因此介于 0.5 到 1 之间。我们在评估的时候,期望 AUC 的数值约接近 1 越好。 
  - COPC:这个指标在展示广告上应用多一些,全称( click over predicted click),copc = 实际的点击率/模型预测的点击率,主要衡量 model 整体预估的偏高和偏低,同样越接近 1 越好,一般情况下在 1 附近波动。
- Log loss:对数损失(Log loss)亦被称为逻辑回归损失(Logistic regression loss)或交叉熵损失(Cross-entropy loss)。在机器学习中,通常把模型关于单个样本预测值与真实值的差称为损失,损失越小,模型越好,而用于计算损失的函数称为损失函数。
- 
pCTR:广告点击率预测(Predict Click-Through Rate) 是广告算法中最核心的技术了。pCTR 要解决的问题是预测特定用户在特定广告位对特定广告当特定环境下的点击概率。为什么 pCTR 如此重要,因为广告排序的核心是 eCPM = pCTR * CPC,CPC 是广告主对点击的出价,是个已知量,所以只有一个 pCTR 变量。当然在实际中不可能是如此简单的排序公式,比如还有质量得分 (Quality Score),比如 Google 的质量得分因素。
pCTR 一般是从离线数据中学习得到的,离线数据是保存到类似 Hive 的分布式数据库中,通过机器学习的算法将 Hive 中的数据进行分析,得到一个 pCTR 模型,这个模型就可以预测 pCTR 了,大致流程就是这样。
  
 
广告计算学术语缩写
| 简写 | 全拼 | 中文名 | 
|---|---|---|
| cell 1 | cell 2 | cell 2 | 
| ADX | AD eXchange | 广告交易平台 | 
| ADN | AD Network | 广告网络 | 
| AUC | Area Under Curve | 曲线下面积 | 
| BT | Behaviorial Targeting | 行为定向 | 
| CoEC | Click on Expected Click | 点击与期望点击的比值 | 
| CoPC | Click on Predicted Click | 实际点击与预测点击的比值 | 
| CTR | Click Through Rate | 点击率 | 
| CDN | Content Delivery Network | 内容分发网络 | 
| CVR | Conversion Rate | 转化率 | 
| CPA | Cost per Action | 转化率 | 
| CPC | Cost per Click | 按点击付费 | 
| CPM | Cost per Mille | 按千次展示付费 | 
| CPS | Cost per Sale | 按销售额付费 | 
| CPT | Cost per Time | 按时间付费 | 
| CRM | Customer Relation Management | 客户关系管理 | 
| DMP | Data Management Platform | 数据管理平台 | 
| EDM | E-mail Direct Marketing | 邮件定向营销广告 | 
| EM | Expectation-Maximization | 最大期望 | 
| EC | Expected Click | 期望点击 | 
| eCPM | Expected Cost per Mille | 千次展示期望收入 | 
| Gap | Gamma-Poisson | r 泊松(泊松分布) | 
| GLM | Generalized Linear Model | 广义线性模型 | 
| GSP | Generalized Second Price | 广义第二高阶 | 
| IAB | Interactive Advertising Bureau | 交互广告局 | 
| LR | Logistic Regression | 逻辑回归 | 
| LDA | Latent Dirichlet Allocation | 潜在迪利克雷分配 | 
| LSA | Latent Semantic Analysis | 潜在语义分析 | 
| MRA | Maximal Representative Allocation | 最大代表性分配 | 
| MAP | Maximum a Posterior | 最大后验概率 | 
| ME | Maximum Entropy | 最大熵 | 
| ML | Mixture Model or Machine Learing | 混合模型 or 机器学习 | 
| MoG | Mixture of Gaussians | 高斯混合模型 | 
| PMP | Private Marketplace | 私有交易市场 | 
| RTM | Real Time Bidding | 实时竞价 | 
| ROC | Receive Operating Characteristic | 接收机操作特性 | 
| ROI | Return on Investment | 投入产出比 | 
| RPM | Revenue per Mille | 千次展示收益 | 
| SEM | Search engine marketing | 搜索引擎营销 | 
| SSP | Supply Site Platform | 供给方平台 | 
| DSP | Demand Side Platform | 需求方平台 | 
参考文献
https://www.jianshu.com/p/c61ae11cc5f6
https://blog.csdn.net/u012762419/article/details/90084155
https://www.cnblogs.com/zhizhan/p/4989053.html
   转载文章时务必注明原作者及原始链接,并注明「发表于 TesterHome 」,并不得对作品进行修改。
  

 
        