《表4 支持度最高的5条规则》

《表4 支持度最高的5条规则》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于主题模型和关联规则的专利文本数据挖掘研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文专利文本关联规则挖掘的实验在R语言环境下进行,将每篇专利作为一项事务tk,其中tk={w1,w2,…,wi},wi是专利中第i个主题的词项,对应关联规则中的一个项目.在R语言中安装并加载arules和Matrix包,加载实验数据时将数据格式format设置为“basket”,将每一条专利记录看作是一个购物篮,专利主题词就是购物篮里的商品.使用apriori()函数进行关联规则挖掘,最小支持度阈值和最小置信度阈值分别为0.006和0.05,将最小规则长度minlen设置为2,避免规则中空项的出现.共生成规则552条,其中置信度、支持度和提升度最高的5条规则如表3~表5所示.在表中,lhs是英文left hand side的缩写,表示规则的前项,rhs是right hand side的缩写,表示规则的后项.通过对表3和表4进行分析,可以挖掘出以下规则: