《表2 部分预处理后的平板电脑评论数据》
收集的数据来源于数据堂(https://www.datatang.com/)中文情感挖掘语料-Chn Senti Corp,该语料库涉及服装、水果、酒店、平板电脑、洗发水5个领域的正面、负面评论,选用了平板电脑的评论语料进行情感分类,其中正面、负面评论分别为4 945条、4 068条。训练集和测试集按照7:3的比例随机抽取,即6 309条训练数据来训练分类模型,剩下的2 704条数据对分类模型的性能进行评估。预处理工作是对评论文本进行极性标注,标签为1代表正面评论,标签为0代表负面评论,部分预处理数据如表2示。
图表编号 | XD00219921300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.25 |
作者 | 李佳儒、王玉珍、丁申宇 |
绘制单位 | 兰州财经大学丝绸之路经济研究院、兰州财经大学信息工程学院、兰州财经大学丝绸之路经济研究院、兰州财经大学信息工程学院、兰州财经大学丝绸之路经济研究院、兰州财经大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |