《表2 ERNIE在测试集上的分类预测情况》

《表2 ERNIE在测试集上的分类预测情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度预训练语言模型的文献学科自动分类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:为便于显示,对学科名称进行了简化。各简化名称对应的全称分别为:体育-体育学;外语-外国语言文学;艺术-艺术学;心理-心理学;法学-法学;教育-教育学;图情-图书馆、情报与档案管理;中文-中国语言文学;新传-新闻传播学;哲学-哲学;历史-历史学;农经-农林经济管理;

为了更加清晰地看出各个学科的分类效果,表3给出了各个学科分类的精确率(precision)、召回率(recall)和F1值(F1 score)。从表3可以看出,体育学分类效果最佳,F1值高达0.9802;外国语言文学、艺术学、心理学、法学也有较好的预测效果,F1值均在0.85以上。相对而言,应用经济学、社会学分类效果较差,F1值低于0.6。从表2可以看出,应用经济学和理论经济学混淆程度很高,有大量相互错误分类的文献,ERNIE预测的应用经济文献中有0.1667的比例为理论经济学;社会学和公共管理的混淆度也较高,社会学的文献有0.0875的比例被错分为公共管理。