《表1 规范化URL过程:自然语言语义库构建方法研究》
标准化的目的是检查是否URL已被抓取或未被抓取,以减少重复的页面并避免时间和内存消耗。URL的组成如下:protocol://hostname[:port]/path/[;parameters][?Query]#fragment。表1描述了URL地址标准化的标准。
图表编号 | XD00100238000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.15 |
作者 | 杨菊英、江兵、罗佳 |
绘制单位 | 电子科技大学成都学院计算机系、四川农业大学商学院、电子科技大学成都学院计算机系 |
更多格式 | 高清、无水印(增值服务) |