《表1 数据来源表:结合卷积和长短期记忆网络的长文分类方法》
本文选取了来自电子文本文献ar Xiv的4类文章和11类文章进行训练.训练数据的详细信息见表1,其中四类文章分别来自表1的1-4个类别,共3839篇长文;11类文章属于表1中5-15个类别,共33213篇长文,可以看出长文的类别方向较为接近.数据集中每类文献的单词数都大于5000,平均单词数量在6000个左右,明显长于常用的文本数据集如(Yahoo!Answers,Amazon Review等).
图表编号 | XD00212221000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 姜恬静、和欣、何军、冯姣、李鹏 |
绘制单位 | 南京信息工程大学电子与信息工程学院、军事科学院系统工程研究院、南京信息工程大学电子与信息工程学院、南京信息工程大学电子与信息工程学院、南京信息工程大学电子与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |