《表2 客户点地址表表头》
(1)将地址文本按行政区域拆分为五级关键词,建立客户点地址表。根据国家行政地址构成,得出如表1所示的五级行政地址划分依据,将客户点行政地址按表1中的五级关键字进行拆分,得到各个客户点的地址词条矩阵。对于只有“市”关键字的,第一、二级关键字自动识别为相同关键字。例如,“重庆市巴南区石龙镇龙鹤路45号”,划分为“重庆、重庆、巴南、石龙、龙鹤”5个词条字存入客户点地址表中;“四川省成都市龙泉驿区新竹大道新都园区北门1号”,划分为“四川、成都、龙泉驿、新竹、新都”5个词条字存入客户点地址表中。如果出现的不规范地址划分完第4个关键字后,没有出现第5个关键字,则将地址中第4个关键字之后到第一个数字号码前所有文字划分为第5个词条。例如,“重庆市沙坪坝区西永街道富康新城宿舍区B10-5-2”,划分为“重庆、重庆、沙坪坝、西永、富康新城宿舍区B”。因为客户点可能分布于道路两侧,聚类时需要将两侧的点分别进行聚类,所以根据门牌单双号分别位于道路两侧的原则,提取行政地址中词条5之后首先出现的数字串记录到词条7中,如果号码为双号,则将词条6记录为“双”,如果号码为单号,则将词条6记录为“单”,将客户点地址中词条7之后的内容全部记录到词条8中,用于词条7无法区分客户时使用,并增设一个备用词条。客户点地址表的内容如表2所示。
图表编号 | XD0067549500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 周翔、许茂增、吕奇光、李丹 |
绘制单位 | 重庆交通大学经济与管理学院、重庆交通大学经济与管理学院、重庆交通大学经济与管理学院、重庆机电职业技术学院工商管理学院 |
更多格式 | 高清、无水印(增值服务) |