《表2 数据集中所有知识节点信息表》

《表2 数据集中所有知识节点信息表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的领域知识对齐模型研究:知识网络视角》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

知识网络对齐是一项具有挑战性的工作,本文采用网络公开的新闻评论多语言数据集(1),在此基础上开展实证研究。选择该数据集的原因在于:(1)该数据集涉及经济和政治等话题,具有领域特性,语句表达较为规范,易于构建领域知识网络;(2)该数据集涵盖中文和英语等多种语言,在各种语言情境下其内容具有可比性,因此适用于开展跨语言知识网络对齐研究;(3)该数据集在跨语言研究中得到了较多的应用,且采取开放下载形式,易于获取。在经过分词和预处理之后,得到中文知识节点35079个,英文知识节点54067个。各个词性的中英文知识节点情况如表2所示。