《表8 融合4类特征模型的RMSE值对比表》
最后,给出一种基于回归性能的评价指标值RMSE,如表7给出了基于最小二乘法学习策略的融合前3类特征的各个模型的RMSE性能表现.由于训练集中非常严重的类别不平衡,点击正例平均占总体的0.0801%,基于回归优化的模型总是更倾向于将CTR预估为接近0的值,因此,预测结果的RMSE与AUC值相比,差距很小.然而,从这些值中依然能够发现,因子分解模型仍然保持着不低于LR的预测性能.张量分解也同样显示出了不低于MF的预测性能.表8给出了基于三元组排序优化学习策略即融合所有4类特征的模型的性能比较.需要强调的是,由于三元组排序优化学习是以排序为优化目标,所以模型的输出值理论上是整个实数域,所以在计算RMSE之前,首先把模型的输出结果使用与文献[40]类似的方法转换到了[0,1]区间实数,然后再计算RMSE.由于基于三元组排序优化的学习重点是优化样本之间的顺序而不是估值准确性,正相反,最小二乘法优化目标恰好是估值的准确性,所以正如我们所料,基于三元组排序化的RMSE值比基于回归的最小二乘法要差一些.
图表编号 | XD0039017300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.20 |
作者 | 单丽莉、林磊、孙承杰 |
绘制单位 | 哈尔滨工业大学计算机科学与技术学院、哈尔滨工业大学计算机科学与技术学院、哈尔滨工业大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |