《表2 ChnSentiCorp子集信息》

《表2 ChnSentiCorp子集信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《BGRU:中文文本情感分析的新方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

语料被整理成了4个子集,其信息如表2所示。其中ChnSentiCorp-Htl-ba-10000的数据量最大,但是正负样本是非平衡的,另外3个子集为平衡数据。为避免训练模型过拟合,本文决定使用平衡数据集中数量最大的ChnSentiCorp-Htl-ba-6000作为数据集,并结合10折交叉验证进行实验。