《表2 ERNIE在测试集上的分类预测情况》
注:为便于显示,对学科名称进行了简化。各简化名称对应的全称分别为:体育-体育学;外语-外国语言文学;艺术-艺术学;心理-心理学;法学-法学;教育-教育学;图情-图书馆、情报与档案管理;中文-中国语言文学;新传-新闻传播学;哲学-哲学;历史-历史学;农经-农林经济管理;
为了更加清晰地看出各个学科的分类效果,表3给出了各个学科分类的精确率(precision)、召回率(recall)和F1值(F1 score)。从表3可以看出,体育学分类效果最佳,F1值高达0.9802;外国语言文学、艺术学、心理学、法学也有较好的预测效果,F1值均在0.85以上。相对而言,应用经济学、社会学分类效果较差,F1值低于0.6。从表2可以看出,应用经济学和理论经济学混淆程度很高,有大量相互错误分类的文献,ERNIE预测的应用经济文献中有0.1667的比例为理论经济学;社会学和公共管理的混淆度也较高,社会学的文献有0.0875的比例被错分为公共管理。
图表编号 | XD00204847200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.24 |
作者 | 罗鹏程、王一博、王继民 |
绘制单位 | 北京大学信息管理系、北京大学图书馆、北京大学图书馆、北京大学信息管理系 |
更多格式 | 高清、无水印(增值服务) |