《表2 症状实体词内部规则模板》

《表2 症状实体词内部规则模板》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于开放信息源的实体挖掘方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

除了使用上下文信息外,还考虑将实体词的构成作为规则的一部分,即内部模式。一个完整的症状实体词的构成,包含了部位、程度、描述三部分。将部位词设定标记符号为“BW”,程度词标记为“CD”,描述词标记为“MS”。导入事先建立的部位、程度、描述三个用户词表,可以得到自定义的分词和词性标记结果。经过分词和词性标记,再利用TokensRegex制定实体词内部规则模板。对于症状词,有如表2所示的实体词内部规则模板。