《表1 2014年背景技术的专利权人-主题识别示例》

《表1 2014年背景技术的专利权人-主题识别示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于专利说明书语义分析的潜在竞争对手识别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:“主题”列括号内数字为主题编号,特征词*号前数字为主题中出现该特征词的概率;“专利权人”列企业括号内数字为企业(专利权人)在该主题上出现的概率。

编写专利权人主题程序,采用主题一致性的UMass度量标准确定主题数目。根据已有经验[46-47],设定超参数α和η的初始值分别为50/K和0.01,主题数K确定为125,模型迭代次数为1000次。将语料库作为输入文件,运行专利权人主题程序,经过多次实验,最终剔除2011—2015年中每年发布专利数量小于10且主题概率小于平均值0.008的专利权人,得到专利权人在125个潜在主题上的概率分布以及特征词在125个潜在主题上的概率分布。表1示例了2014年背景技术的部分主题与专利权人情况,其中每个主题选取概率较高的前10个特征词描述。从主题特征词可以推断出这5个主题分别对应农村饮用水、自来水净水设备、细菌和杂质净水器、湖泊水生态、工业污泥5个方面。虽然不同主题间存在部分重复特征词,如主题2和主题3都出现了水、净水、滤芯,但在研读了具体专利后发现,主题2主要针对家庭自来水的一般过滤,主题3则主要净化水中的细菌和杂质,应用领域既涉及家庭,也涉及农业和工业等领域,因此主题间还是有一定区别的,各主题间边界基本清晰。