《表2 THUCNEWS数据集实验比较》

《表2 THUCNEWS数据集实验比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于WSD层级记忆网络建模的文档表示方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在THUCNEWS数据集中进行分类实验,实验分别通过TF-IDF,Word2vec以及本文所采用的Bert模型进行语言预处理,同时分别与传统机器学习算法SVM、传统LSTM以及基于注意力机制的BiLSTM算法结合,对实验结果进行分析,见表2。由于该数据集的分类较为精准,类间数据界限分明且数据量相对平衡,基于机器学习SVM算法上达到95.2%,在传统LSTM算法上准确率为94.8%,基于word2vec-LSTM算法准确率达96.53%,基于本文提出的组合算法准确率达95.07%。