《表1 0 糖尿病相关论文社交媒体可见性预测结果》
采用7种不同的机器学习算法对学术论文的社交媒体可见性进行预测,结果如表10所示。其中,LightGBM、随机森林和AdaBoost等集成学习算法效果较好,三个分类模型的F1值都达到0.70左右,LightGBM方法的分类准确率达到0.70,随机森林和AdaBoost模型的准确率分别为0.69和0.68,说明在本文确定的学术论文特征框架下,集成学习的方法通过将多个分类器学到的信息互补,能够更有效地预测学术论文的社交媒体可见性。另外,传统的机器学习方法,如逻辑回归、支持向量机,在本文定义的分类任务中表现较为一般。支持向量机模型的F1值和准确率都达到0.68,逻辑回归模型的F1值和准确率都达到0.67。朴素贝叶斯方法和人工神经网络应用于学术论文社交媒体可见性预测的表现稍差,尽管朴素贝叶斯模型的F1值达到0.68,但其准确率仅有0.54,精确率也仅有0.53,而召回率异常偏高,人工神经网络的F1值达到0.67,准确率仅有0.65,而召回率达到0.99,说明这两个模型将大量样本预测为正类,存在一定偏差。
图表编号 | XD00157151100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.25 |
作者 | 李纲、管为栋、马亚雪、毛进 |
绘制单位 | 武汉大学信息资源研究中心、武汉大学信息资源研究中心、武汉大学信息资源研究中心、武汉大学信息资源研究中心 |
更多格式 | 高清、无水印(增值服务) |