《表2 情感文本数据集:一种结合随机游走和粗糙决策的文本分类方法》
实验数据采用第6届中文倾向性分析评测语料及第3届自然语言处理与中文计算会议评测语料,记作COAE2014及NLPCC2014,在COAE2014中提取其中对食品饮料的评论文本400篇,其中正面文本200篇,负面文本200篇;在NLPCC2014中提取其中对音乐及电影的评论400篇,其中正面文本200篇,负面文本200篇,总计共800篇文本语料.由于评论中人群主要涉及对于食品饮料使用及电影观看后的评价,都是作为普通消费者人群,因此具有一定的代表性.使用其中600篇语料作为训练数据集,剩余200篇作为测试数据集.通过分词工具对所有文本进行分词及词性标注,并采用人工方式对文本情感类别进行标注,情感文本数据集如表2所示.
图表编号 | XD0079865800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 韩飞、柴玉梅、王黎明、刘箴 |
绘制单位 | 郑州大学信息工程学院、郑州大学信息工程学院、郑州大学信息工程学院、宁波大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |