《表3 情感词汇示例:一种结合随机游走和粗糙决策的文本分类方法》
通过第3.1节介绍的方法后获取候选文本属性集,由于选取较少特征词会损失一定的实验精度,选取过多特征词虽不会对结果造成直接影响,但会造成数据冗余,提高算法的时间复杂度.王素格等[28]提出一种面向非平衡文本情感分类的TSF特征选择方法,通过在COAE2014选取的图书评论数据集,显式组合正相关和负相关特征,去考量特征的平衡性用以表达文本信息.本文综合文本数量及文本平衡性,为使特征词的选择能更好代表实验结果,因此在600篇训练数据集里,选取候选特征词700个,里面包括了积极词汇特征数350个,消极词汇特征数350个,部分词汇特征如表3所示.
图表编号 | XD0079865600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 韩飞、柴玉梅、王黎明、刘箴 |
绘制单位 | 郑州大学信息工程学院、郑州大学信息工程学院、郑州大学信息工程学院、宁波大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |