《表1 ChnSentiCorp数据集样例》
为了验证本文提出的模型的有效性,选用了有关中文情感挖掘的酒店评论语料(Chn Senti Corp)作为测试集,该语料是由中国科学院谭松波博士收集整理的一个酒店评论的语料,其公布的语料规模为10 000篇,从携程网上自动采集,并经过整理而成。语料被整理成四个子集,由于文本情感分析的特殊性,本文采用Chn Senti Corp-Htl-ba-6000的数据来进行实验,该语料为平衡语料,包含正负类各3 000篇。表1为数据集样例。
图表编号 | XD00107241300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 胡荣磊、芮璐、齐筱、张昕然 |
绘制单位 | 北京电子科技学院电子与通信工程系、北京电子科技学院电子与通信工程系、北京电子科技学院电子与通信工程系、北京电子科技学院电子与通信工程系 |
更多格式 | 高清、无水印(增值服务) |