《表5 数据集示例:人工智能背景下网络舆情数据识别及管理研究》
数据预处理的第1步,对数据集进行文本标注。首先标注出有效诉求数据992779条,并将其作为正样本(标签为“1”),无效诉求数据313163条,作为负样本(标签为“0”)。最终使用以上1305942条数据形成文本数据集,部分数据如表5所示。抽取数据集的80%数据作为训练集,20%数据为测试集。
图表编号 | XD00223294400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.20 |
作者 | 卓琳、陈圣群 |
绘制单位 | 福建江夏学院电子信息科学学院、福建商学院信息工程学院 |
更多格式 | 高清、无水印(增值服务) |