《表2 典型出价策略的特点分析》
遗憾的是,无论是线性还是非线性出价策略,在针对每个广告展示机会出价时,都只针对这次广告展示能够带来的回报,而没有考虑对后续广告展示机会竞价产生的影响,即出价决策只考虑已经发生的事实.一种更为理想的出价策略是将每次出价决策与整个投放周期的竞标过程关联起来(包括未发生的后续竞拍),将整个投放周期的广告展示机会的拍卖作为一个连续动态的决策过程,不仅关注眼前回报,也需要关注未来的回报,动态地调整出价.而以马尔可夫决策过程为载体的深度强化学习正好符合这个目标,将出价作为一个连续的决策,为每一个广告展示机会生成最优的出价(曝光粒度的优化),来优化动态RTB环境下的广告效果,从而获得最大化的长期回报.因此,基于强化学习的出价策略被认为是获得最优出价的理想解决方案.表2分别从出价策略类别、是否进行在线调整、优化目标三个方面对典型出价策略的特点进行分析.
图表编号 | XD00197648000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 刘梦娟、岳威、仇笠舟、李家兴、秦志光 |
绘制单位 | 电子科技大学网络与数据安全四川省重点实验室、电子科技大学网络与数据安全四川省重点实验室、电子科技大学网络与数据安全四川省重点实验室、电子科技大学网络与数据安全四川省重点实验室、电子科技大学网络与数据安全四川省重点实验室 |
更多格式 | 高清、无水印(增值服务) |