《表5 改进前后性能对比:面向科技大数据的元数据仓储建设实践探索》
随机选取2019年度标题里含有“人工智能”的元数据6470条,利用相似度算法筛选出题名相似度达到90%以上的元数据4071条,经过人工核实校验,逐条比对论文的作者、发文期刊,发现重复数据3条,重复率0.046%,属于可接受范围。
图表编号 | XD00204822100 严禁用于非法目的 |
---|---|
绘制时间 | |
作者 | 张勇、苏学、谢振峰 |
绘制单位 | 中国科学技术信息研究所、北京万方数据股份有限公司、北京万方数据股份有限公司、北京万方数据股份有限公司 |
更多格式 | 高清、无水印(增值服务) |