《表1 服装评价数据集字段》
文中采用的数据集来自于kaggle网站的公开数据集Womens Clothing E-Commerce Reviews,该数据集有11个字段,详见表1。研究中选取了第五列的评价文本,以及第七列的文本标签用于实验。经统计在该数据集中,共有23 486条评论数据。其中有19 314个好评,以及4 172个差评,为了能够使好评和差评数量均衡,随机选取了4 172个好评,以及全部的差评进行了实验,共计8 344条文本数据。至此,单词结点数有4 557个,设置词嵌入维度为200,主题数为15。训练集输入70%、即5 840条数据,测试集为30%、即2 504条数据,窗口大小20,对文本进行200个epoch的训练,如果损失函数超过10个epoch没有减少,就停止训练。学习率设置为0.02,dropout为0.5。
图表编号 | XD00192316700 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.01 |
作者 | 姚婷婷、刘国华 |
绘制单位 | 东华大学计算机科学与技术学院、东华大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |