《表4 加入LFM嵌入前后特征重要性top10特征对比》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《隐式反馈场景下的LFM-XGB-LR融合推荐算法》
从实验结果可以看出,本文提出的LFM-XGB-LR融合模型在评估上对比传统模型有明显提升。具体分析来看,第一,基于LFM的用户偏好嵌入和物品特性嵌入作为高阶特征,更加充分地挖掘了用户的隐式反馈数据,使得特征表达更加充分和完整,可以看到加入Embedding特征的各组模型的指标均得以提升;对比LFM嵌入前后特征重要性top10(表4),特征重要性以特征被选作分裂节点的次数计算,用户偏好嵌入特征重要性排进top10,且在37/80棵决策树的根节点被选用,说明用户嵌入有效缓解了用户互动行为稀疏导致的低阶偏好特征重要性低的问题,模型更加“重视”用户偏好特征,从而提升了模型的个性化性能;同时,从图5的视频类别变化看出,LFM嵌入修正了推荐视频的类别分布,各个类别的视频更加均匀,这使得更多类型的优秀视频能被推荐给更多用户,有效改善了视频严重倾斜到单一类别上导致的调性单一以及拉空优质视频库的问题。第二,融合模型充分发挥了XGBoost模型在特征交叉上的优异性能,能够根据信息增益自动做特征交叉,省去了人工做笛卡尔特征交叉的工作,且选择出的交叉特征更加有效;XGBoost分布式的运算架构也提高了分布式数据集上的算法效率。第三,LR模型在离散特征的处理上效率优于连续特征,且特征表达的充分与否对模型性能至关重要,本文的融合模型结合了LFM嵌入和XGB交叉特征优势并且进行了合理的特征离散化,各项评估指标表明,LR模型的优势得以很好地发挥。
图表编号 | XD00134375400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 程晓娜、孙志锋 |
绘制单位 | 浙江大学电气工程学院、浙江大学电气工程学院 |
更多格式 | 高清、无水印(增值服务) |