《表1 数据集信息:基于双视角投影空间表示的文本多标签标注方法》
本文实验采用的数据来自广泛使用的雅虎和路透社新闻数据集[29],雅虎数据集中以正文作为第一个视角,读者评论作为第二视角,同时包括实用、无聊、超扯、开心和火大在内的五个情绪标签;路透社数据集使用正文作为第一个视角,标题作为第二个视角,包含地点、组织、交易所、人物和主题的五个类别标签,如表1所示。实验过程中对数据进行划分,随机选取数据中的50%作为训练集,剩下的50%中,选择五分之一的数据作为模型的验证集,剩下的五分之四作为测试集。
图表编号 | XD00222755600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.05 |
作者 | 温雯、韦滨、杜文俊、蔡瑞初、郝志峰 |
绘制单位 | 广东工业大学计算机学院、广东工业大学计算机学院、东北大学工商管理学院、广东工业大学计算机学院、广东工业大学计算机学院、佛山科学技术学院数学与大数据学院 |
更多格式 | 高清、无水印(增值服务) |