《表2 短语抽取结果中的前20个短语》
本实验采用第2.2.1节描述的融合多统计量的短语抽取方法和基于词向量的噪声短语过滤方法来抽取专利标引短语,即:首先融合词频、互信息、左右邻接熵等统计量进行初步短语识别,然后利用专利词向量进行过滤,以提高短语识别准确率,通过实验最终识别出4894个短语,前20个短语如表2所示。
图表编号 | XD00121821400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.24 |
作者 | 高影繁、王峥、胡小荣、姚长青、梁娜 |
绘制单位 | 中国科学技术信息研究所、中国科学院文献情报中心、中国科学技术信息研究所、中国科学技术信息研究所、中国科学技术信息研究所 |
更多格式 | 高清、无水印(增值服务) |