《表1 数据集格式:基于GRU和注意力机制的远程监督关系抽取》

《表1 数据集格式:基于GRU和注意力机制的远程监督关系抽取》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于GRU和注意力机制的远程监督关系抽取》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本次实验采用的数据集是通过将Freebase中的实体对与纽约时报语料库(NYT)对齐而生成的。该数据集[10]是Riedel等人在2010年首次开发使用的,该数据集使用斯坦福大学的命名实体识别工具对纽约时报语料库进行实体标注,然后再与Freebase中的实体进行匹配,生成数据集格式如表1所示。表中第一列中的两行分别表示第一个实体和第二个实体的ID,第二列中的两行分别表示两个实体,第三列表示关系,第四列表示句子。假设(Hunan,contains,Changsha)就是Freebase中的一条三元组数据:“one reason is that Hunan's fast-growing provincial capital Changsha is beginning to siphon some workers”就是纽约时报语料库的一个句子,将Hunan和Changsha与句子中相同实体对应起来就组成了一条数据。