《表5 专利相似度混淆矩阵》

《表5 专利相似度混淆矩阵》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《KEC:基于cw2vec的中文专利关键词提取方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本章利用KEC模型从专利中提取的关键词代表专利,度量两个专利之间的相似性。众所周知,IPC分类号是一种分层次对专利分类的标准。根据IPC分类规则,同一类别的专利往往位于同一分支下,并具有一定的相似性。本文抽取IPC分类号为G06F的专利,并且认为该分类下最小类中专利才具有相似性,相反,认为其他专利不相似。比如IPC分类号同为G06F17/30的专利被认定为相似专利,但这些专利与IPC分类号为G06F17/20的专利被认定为不相似的专利。按照以上规则,标记出100对相似专利和100对不相似专利。基于标记数据实验得到评估专利相似性的混淆矩阵如表5所示。