《表2 不同值的预处理:基于网页结构与语言特征的垃圾网页链接检测方法》
属性的值有五种类型:数值、链接、键值对、自定义字符和html内部值.自定义字符是指用于内容或标题或为当前标签做的记号值,html内部值是指属性本身具有枚举类型的值.以上五种类型的值需要进一步处理(见表2)再生成特征向量.
图表编号 | XD00145462300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.15 |
作者 | 杨望、江咏涵、张三峰 |
绘制单位 | 东南大学网络空间安全学院、东南大学网络空间安全学院、东南大学网络空间安全学院 |
更多格式 | 高清、无水印(增值服务) |