《表1 基于编辑距离纠正中文机构名称示例》

《表1 基于编辑距离纠正中文机构名称示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于搜索引擎与规则的中文实体名称消歧方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对于未登录机构名称,搜索引擎不能将该类型消歧。本文采取基于编辑距离的机构名称修正方法。编辑距离(Edit Distance),又称Levenshtein距离,是指两个字符串之间,由一个转化成另一个所需的最少编辑操作次数。编辑操作支持插入、删除、修改三种操作。编辑距离常用语拼写错误纠正场景下,针对已输入错误文本智能识别并提示纠正后的文本。本文选取编辑距离为1或2的机构名称进行修正,如表1所示。