《表5 语料信息:基于词典的文本极性计算及分类研究》
本次实验使用的语料数据是利用爬虫技术爬取某大型电商平台上关于“999感冒药”销售的评论数据,去除不规范文本,最终选出2550条评论数据。手工对所有数据进行情感倾向性标注,然后把所有语料分为两部分,其中2100条评论作为训练语料,其余的450条作为测试语料,语料基本信息如表5所示。图4为语料的句子长度分布,图5以词云的形式展示了语料的一些关键信息。
图表编号 | XD00139080900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 薛兴荣、靳其兵 |
绘制单位 | 北京化工大学信息科学与技术学院、北京化工大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |