《表1 实体同义词词典:面向水利信息资源的智能问答系统构建与应用》
抽取实体的文本信息,然后对概念和实体使用消歧模板抽取文本中的实体的同义词。本文使用Java正则表达式来表示模板,可抽取常简称、又称、又名、俗称、古称、原名、也叫这些词后面的词语,并且分割中间出现“、”和“或”的词语。例如上面“太湖”的例子中“古称具区、震泽,又名笠泽、五湖”,可抽取出“具区”“震泽”“笠泽”“五湖”4个词语。Infobox信息抽取概念或实体的“别名”属性,将其属性值抽取为实体的同义词。最后将这些同义词存放到同一个组里来表述这同一个词。表1所示为部分实体同义词词典。
图表编号 | XD00134287400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 张紫璇、陆佳民、姜笑、冯钧 |
绘制单位 | 河海大学计算机与信息学院、河海大学计算机与信息学院、河海大学计算机与信息学院、河海大学计算机与信息学院 |
更多格式 | 高清、无水印(增值服务) |