《表5 使用不同特征时XGB算法下的二元分类模型的准确率》
选取元组2,K为7时LDA模型的结果作为发布模式特征。分别采用以下四种特征用于兴趣预测:(1)用户个人资料特征和帖子类型特征;(2)用户行为特征,即用户个人资料特征、帖子类型特征和发布模式特征;(3)用户行为特征用户个人资料特征、帖子类型特征和从用户点赞的主页中提取的语义特征;(4)所有特征,即用户个人资料特征、帖子类型特征、用户发布模式特征和从用户点赞的主页中提取的语义特征。表5中展示了对于各个兴趣组,分别采用上述四种特征时二元分类模型的准确率,最佳结果标记为粗体。可以看到,使用特征2比使用特征1时的平均准确率高0.03,使用特征4比使用特征3时的平均准确率高0.02。这表明使用用户发布模式分布可以有效提高用户兴趣预测的准确率。除了旅行组,对于大多数兴趣组,使用所有特征时,预测的准确率最高,平均准确率达到0.81。
图表编号 | XD00163005700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 胡璨、崔晓晖 |
绘制单位 | 武汉大学国家网络安全学院、武汉大学国家网络安全学院 |
更多格式 | 高清、无水印(增值服务) |