《表2 基于疾病百科词条抽取的心血管领域术语及关系类型统计》

《表2 基于疾病百科词条抽取的心血管领域术语及关系类型统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《小规模知识库指导下的细分领域实体关系发现研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

综合考虑网络用户用词习惯、概念术语丰富度和概念类型精准度等因素,我们采用兼顾专业性和开放性的领域网络百科为数据来源构建该术语集。具体数据源为“39健康网”中的“疾病百科”[31],按“心血管内科”,筛选得到疾病词条394个。以火车头采集器V8.5为工具,采集各疾病条目下相对应的疾病别名、发病部位、相关症状、并发疾病、相关检查等字段,采集领域术语2149个;并按照疾病和各属性对应关系,构造影响部位、症状表征、并发疾病、诊断方式四种细粒度关系。在此基础上,为了便于后续学习到疾病的层次关系,利用已采集疾病术语的文本包含关系生成部分层次关系(如“急性心脏病”包含“心脏病”,因而是其子类)。最终构造的知识库术语、关系类型及数量如表2所示。