《表2 不同匹配数的性能指标》
验证网页是否处于基于TF-IDF和数据集字向量距离的网页删除算法中的标准,即判断两个文本的关键词是否相同,Word2Vec找到多少个与关键词最接近的词,使得算法具有最高的精度。将500个文本作为数据集抓取,其中包含50个文本,其内容重复,这意味着对原始文本进行少量修改。根据不同匹配的数目,算法的精确率和召回率如表2所示。
图表编号 | XD00100237900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.15 |
作者 | 杨菊英、江兵、罗佳 |
绘制单位 | 电子科技大学成都学院计算机系、四川农业大学商学院、电子科技大学成都学院计算机系 |
更多格式 | 高清、无水印(增值服务) |