《表2 症状实体词内部规则模板》
除了使用上下文信息外,还考虑将实体词的构成作为规则的一部分,即内部模式。一个完整的症状实体词的构成,包含了部位、程度、描述三部分。将部位词设定标记符号为“BW”,程度词标记为“CD”,描述词标记为“MS”。导入事先建立的部位、程度、描述三个用户词表,可以得到自定义的分词和词性标记结果。经过分词和词性标记,再利用TokensRegex制定实体词内部规则模板。对于症状词,有如表2所示的实体词内部规则模板。
图表编号 | XD0072245300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 王莉军、李旭婕、刘志辉、翟云 |
绘制单位 | 中国科学技术信息研究所、中央党校(国家行政学院)电子政务研究中心、北京科技大学、中国科学技术信息研究所、富媒体数字出版内容组织与知识服务重点实验室、中央党校(国家行政学院)电子政务研究中心 |
更多格式 | 高清、无水印(增值服务) |