《表1 数据集格式:基于GRU和注意力机制的远程监督关系抽取》
本次实验采用的数据集是通过将Freebase中的实体对与纽约时报语料库(NYT)对齐而生成的。该数据集[10]是Riedel等人在2010年首次开发使用的,该数据集使用斯坦福大学的命名实体识别工具对纽约时报语料库进行实体标注,然后再与Freebase中的实体进行匹配,生成数据集格式如表1所示。表中第一列中的两行分别表示第一个实体和第二个实体的ID,第二列中的两行分别表示两个实体,第三列表示关系,第四列表示句子。假设(Hunan,contains,Changsha)就是Freebase中的一条三元组数据:“one reason is that Hunan's fast-growing provincial capital Changsha is beginning to siphon some workers”就是纽约时报语料库的一个句子,将Hunan和Changsha与句子中相同实体对应起来就组成了一条数据。
图表编号 | XD0090318600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 黄兆玮、常亮、宾辰忠、孙彦鹏、孙磊 |
绘制单位 | 桂林电子科技大学广西可信软件重点实验室、桂林电子科技大学广西可信软件重点实验室、桂林电子科技大学广西可信软件重点实验室、桂林电子科技大学广西可信软件重点实验室、桂林电子科技大学广西可信软件重点实验室 |
更多格式 | 高清、无水印(增值服务) |