《表1 本实验所标注数据:基于卷积神经网络的旅游领域实体关系抽取》
本实验共收集了6885条数据,包括旅游攻略、用户评价、景点简介等.本文通过词频统计的方法,对采集的数据进行分析处理,分析有关于新疆旅游领域所收集语料,总结归纳后定义了17中实体关系对.如表1所示,对所采集的数据进行预处理操作包括过滤、去重及分词等操作.在数据标注阶段,开发设计语料标注系统,规定该语料的标注格式.标注时将预处理后的数据导入系统中,单击选择需要标注的实体1、实体2及两者所属关系既可完成标注,生成我们所需的标注格式,避免了大量人工复杂的操作,实现半自动化标注.标注结果如例2所示,
图表编号 | XD00121916100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 殷纤慧、古丽拉·阿东别克 |
绘制单位 | 新疆大学信息科学与工程学院、国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地、新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |