《表2 各种关系类型标注数量》

《表2 各种关系类型标注数量》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《汉藏双语旅游领域知识图谱系统构建》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用Xpath网站爬虫技术爬取汉文景点介绍文本。首先,将爬取的汉文语料经过分句、分词、词性标注等预处理过程,然后进行人工标注获取标注语料,共计8 479条实体关系实例,每种关系类型按照训练集和测试集8∶2进行随机分配。其中,训练集包含6 783条实例关系,测试集包含1 696条实例关系。各种关系类型标注详细数量如表2所示。