《表1 1 候选实体对结果示例》
由于原始实体数据量较大,计算两两实体余弦相似度耗时较久,且对实验设备的性能要求较高,因此本次实验只选取前500条专利的三元组技术实现路径进行了实体对齐。计算出这500条专利实体对间的相似度后,选取相似度大于0.9的实体对加入候选实体集。技术主题词和功效词的前5条候选实体对统计结果如表11所示。可以发现相似度大于0.9的实体对之间语义都是比较相近的,如“Internet-of-things”和“Internet-of-things technology”,“Cloud computing”和“Cloud computing technology”等,因此需要对这样的实体对进行筛选处理。对于语义相近的实体对,本次实验选择只保留其中的一种表达方式,并且后续如果该表达方式再次出现比较,仍以这一种方式为准。技术实现路径的具体示例将在后续的可视化结果中展示。
图表编号 | XD00211520500 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.10 |
作者 | 张金柱、李溢峰 |
绘制单位 | 南京理工大学经济管理学院 |
更多格式 | 高清、无水印(增值服务) |