《表3 Amazon数据集的数据格式》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于垂直集成Tri-training的虚假评论检测模型》
Amazon数据集包含580万条评论、214万用户和670万个产品,涉及3个领域的书籍、音乐DVD和工业产品。数据的标签采用基于规则标注的方法来标记,其优点是基于规则标注的方法不依赖于人工,标记的成本低,很容易获得大量的标签数据,不足之处是会包含一定的噪声。表3显示了Amazon数据集的特定属性。
图表编号 | XD00197688500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.10 |
作者 | 尹春勇、朱宇航 |
绘制单位 | 南京信息工程大学计算机与软件学院、南京信息工程大学计算机与软件学院 |
更多格式 | 高清、无水印(增值服务) |