《表1 工作单位信息中相同机构的不同写法》

《表1 工作单位信息中相同机构的不同写法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于类中心向量的论文作者归属机构自动识别方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在识别论文作者所归属的组织机构过程中,相同机构的作者地址信息在不同的英文论文中可能出现多种不同的写法,这给计算机将作者地址信息与机构名称进行匹配造成了困难。例如,在图1中,三位作者均来自同一组织机构,但是他们所撰写的5篇论文中,对该组织机构却有两种不同的作者地址信息写法。产生这一现象的原因多种多样,有的是因为单位曾经有多个不同的名称,有的是因为作者使用单位名称的缩写,最常见的是作者没有严格依据单位的组织层级关系逐级书写单位信息,其中的一些例子如表1所示。除此之外,同一个机构的地理位置信息写法也可能存在多种不同的形式,如使用街道名称缩写、使用不同的门牌格式等。这些情况使得计算机无法通过使用单一的机构名称与作者地址信息进行字符串匹配,来对作者归属机构进行识别。