《表1 原始地址数据格式》
注:数据来源于广东省广州市航天精一(广东)信息科技有限公司。
本研究数据为航天精一(广东)信息科技有限公司提供的惠州市151 000条原始文本地址,每条地址数据记录包含不同的地址层级,地址层级皆从高到低。原始中文地址文本数据中存在重复地址、层级错乱、单条地址记录不完整、地址记录错误等问题。因此,对原始数据进行数据清洗,删除重复记录,纠正层级错乱记录。记录不完整和错误记录则继续保留以增强模型的容错能力。经以上数据预处理后,剩下15万条地址文本。原始地址数据格式如表1所示。
图表编号 | XD0056579500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.25 |
作者 | 程博、李卫红、童昊昕 |
绘制单位 | 华南师范大学地理科学学院、华南师范大学地理科学学院、航天精一(广东)信息科技有限公司 |
更多格式 | 高清、无水印(增值服务) |