《表3 层级地址标注体系》

《表3 层级地址标注体系》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BiLSTM-CRF的中文层级地址分词》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据2009年中国国家标准化管理委员会发布的数字城市地理信息公共平台地名/地址编码规则,并结合实际地址命名情况,可知中文地址大致分为行政区域地名、街巷名、小区名、门(楼)址和标志物名五级地址,各级地址包含相应的细分地址[27]。地址数据需要经过标注后才能输入模型进行训练。多数研究使用(B,M,E,S)四词位标注集来对训练数据进行标注。本研究在四词位基础上增加了词位标注A来表示地址后缀(表2),如“广东省”中“省”字既是单字词也是省级地址后缀,因此使用“省|S_PRO-A”来进行标注。各层级地址均根据所属的层级结合(B,M,E,S)标注集进行标注(表3)。