《表2 各种关系类型标注数量》
利用Xpath网站爬虫技术爬取汉文景点介绍文本。首先,将爬取的汉文语料经过分句、分词、词性标注等预处理过程,然后进行人工标注获取标注语料,共计8 479条实体关系实例,每种关系类型按照训练集和测试集8∶2进行随机分配。其中,训练集包含6 783条实例关系,测试集包含1 696条实例关系。各种关系类型标注详细数量如表2所示。
图表编号 | XD00109145500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 冯小兰、赵小兵 |
绘制单位 | 中央民族大学信息工程学院、中央民族大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |