《表2 网页标签的类别划分》
为引入网页结构特征并验证集成学习方法的效果,在实验环节将网页HTML文本数据根据其元标签类型分为如下子数据集:1)标题;2)元数据标签页;3)各级小标题;4)特殊字体类标签;5)网页正文和table标签。根据观察得出不同标签类别对判别网页结果的影响不同,本研究中将网页文本数据分为如下类别,如表2。采用上述5类数据进行ACNN基学习器的构建。
图表编号 | XD00201771700 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.10 |
作者 | 周超然、赵建平、马太、周欣 |
绘制单位 | 长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院 |
更多格式 | 高清、无水印(增值服务) |