《表2 ChnSentiCorp子集信息》
语料被整理成了4个子集,其信息如表2所示。其中ChnSentiCorp-Htl-ba-10000的数据量最大,但是正负样本是非平衡的,另外3个子集为平衡数据。为避免训练模型过拟合,本文决定使用平衡数据集中数量最大的ChnSentiCorp-Htl-ba-6000作为数据集,并结合10折交叉验证进行实验。
图表编号 | XD0091254800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 曹宇、李天瑞、贾真、殷成凤 |
绘制单位 | 西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |