《表2 数据集中所有知识节点信息表》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的领域知识对齐模型研究:知识网络视角》
知识网络对齐是一项具有挑战性的工作,本文采用网络公开的新闻评论多语言数据集(1),在此基础上开展实证研究。选择该数据集的原因在于:(1)该数据集涉及经济和政治等话题,具有领域特性,语句表达较为规范,易于构建领域知识网络;(2)该数据集涵盖中文和英语等多种语言,在各种语言情境下其内容具有可比性,因此适用于开展跨语言知识网络对齐研究;(3)该数据集在跨语言研究中得到了较多的应用,且采取开放下载形式,易于获取。在经过分词和预处理之后,得到中文知识节点35079个,英文知识节点54067个。各个词性的中英文知识节点情况如表2所示。
图表编号 | XD00168286600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.24 |
作者 | 余传明、李浩男、安璐 |
绘制单位 | 中南财经政法大学信息与安全工程学院、中南财经政法大学统计与数学学院、武汉大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |