《表1 中文停用词表节选:基于BERT-LSTMCNN的立场分析》
根据微博文本的内容人工标记数据立场,支持“垃圾分类”为1、反对“垃圾分类”为-1,中立为0。已标记文本数据去除标点并使用jieba分词工具分词后,采用哈工大停用词表,百度停用词表合并去重后构成中文停用词表,如表1所示。语料数据去除中文停用词后得到的结果如表2所示。
图表编号 | XD00132514100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.25 |
作者 | 胡瑞雪、曾曦 |
绘制单位 | 中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所 |
更多格式 | 高清、无水印(增值服务) |