《表3 人工评判结果比较:基于三重维度的企业风险信息抽取方法研究》
为了对实验结果进行评估,本文分别从基于HanLP的短语识别结果和改进的风险短语识别结果中随机抽取1000个风险短语,分别由3位情报学领域的研究生判断是否构成短语以及具体的构词规则。针对同一个短语,若有两位或两位以上的研究生判断结果相同,则取该结果作为最终评判结果。最终得到的结果如表3所示。可以看出,基于Han‐LP的短语识别算法准确率约为70.5%,而本文提出的改进后的风险短语识别方法准确率约为80.6%,且后者识别出的风险短语构词规则更多样化。相比之下,改进后的风险短语识别方法能够识别出更多准确短语,且构成短语的词汇词性更多样化。
图表编号 | XD00121820100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.24 |
作者 | 梁娜、姚长青、王峥、高影繁、李岩 |
绘制单位 | 中国科学技术信息研究所、中国科学技术信息研究所、中国科学院文献情报中心、中国科学技术信息研究所、中国科学技术信息研究所 |
更多格式 | 高清、无水印(增值服务) |