《表2 THUCNEWS数据集实验比较》
在THUCNEWS数据集中进行分类实验,实验分别通过TF-IDF,Word2vec以及本文所采用的Bert模型进行语言预处理,同时分别与传统机器学习算法SVM、传统LSTM以及基于注意力机制的BiLSTM算法结合,对实验结果进行分析,见表2。由于该数据集的分类较为精准,类间数据界限分明且数据量相对平衡,基于机器学习SVM算法上达到95.2%,在传统LSTM算法上准确率为94.8%,基于word2vec-LSTM算法准确率达96.53%,基于本文提出的组合算法准确率达95.07%。
图表编号 | XD00163079500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 张柯文、李翔、朱全银、方强强、马甲林、成洁怡、丁行硕 |
绘制单位 | 淮阴工学院计算机与软件工程学院、淮阴工学院计算机与软件工程学院、淮阴工学院计算机与软件工程学院、淮阴工学院计算机与软件工程学院、淮阴工学院计算机与软件工程学院、淮阴工学院计算机与软件工程学院、淮阴工学院计算机与软件工程学院 |
更多格式 | 高清、无水印(增值服务) |