《表1 2014年背景技术的专利权人-主题识别示例》
注:“主题”列括号内数字为主题编号,特征词*号前数字为主题中出现该特征词的概率;“专利权人”列企业括号内数字为企业(专利权人)在该主题上出现的概率。
编写专利权人主题程序,采用主题一致性的UMass度量标准确定主题数目。根据已有经验[46-47],设定超参数α和η的初始值分别为50/K和0.01,主题数K确定为125,模型迭代次数为1000次。将语料库作为输入文件,运行专利权人主题程序,经过多次实验,最终剔除2011—2015年中每年发布专利数量小于10且主题概率小于平均值0.008的专利权人,得到专利权人在125个潜在主题上的概率分布以及特征词在125个潜在主题上的概率分布。表1示例了2014年背景技术的部分主题与专利权人情况,其中每个主题选取概率较高的前10个特征词描述。从主题特征词可以推断出这5个主题分别对应农村饮用水、自来水净水设备、细菌和杂质净水器、湖泊水生态、工业污泥5个方面。虽然不同主题间存在部分重复特征词,如主题2和主题3都出现了水、净水、滤芯,但在研读了具体专利后发现,主题2主要针对家庭自来水的一般过滤,主题3则主要净化水中的细菌和杂质,应用领域既涉及家庭,也涉及农业和工业等领域,因此主题间还是有一定区别的,各主题间边界基本清晰。
图表编号 | XD00204849500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.24 |
作者 | 史敏、罗建、蔡丽君 |
绘制单位 | 湖南农业大学商学院、湖南农业大学商学院、湖南农业大学商学院 |
更多格式 | 高清、无水印(增值服务) |