《表2 专利文本特征抽取模型的测试结果》

《表2 专利文本特征抽取模型的测试结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于人工智能专利图谱的技术热点发现以及演化分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:测试数据1为4000组全领域三元组准确率;测试数据集2为2000组手工代码T01下三元组准确率

表2为本文训练的Doc2vec专利文本抽取模型与经典的文本特征抽取模型的测试结果,从测试结果中可以看出本文训练的Doc2vec模型在专利特征抽取上远高于传统的词袋模型Tf-idf、主题模型LSA、LDA。在测试数据集1(4000组全领域三元组)中Doc2vec模型的准确率达到了86.5%,超过最好的LDA主题模型8.4%。在难度更高的测试数据集2(2000组手工代码T01下三元组)中,所有模型的准确率都有所下降,但Doc2vec的准确率依然达到76.5%,是所有模型中最高的。