《表3 人工评判结果比较:基于三重维度的企业风险信息抽取方法研究》

《表3 人工评判结果比较:基于三重维度的企业风险信息抽取方法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于三重维度的企业风险信息抽取方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了对实验结果进行评估,本文分别从基于HanLP的短语识别结果和改进的风险短语识别结果中随机抽取1000个风险短语,分别由3位情报学领域的研究生判断是否构成短语以及具体的构词规则。针对同一个短语,若有两位或两位以上的研究生判断结果相同,则取该结果作为最终评判结果。最终得到的结果如表3所示。可以看出,基于Han‐LP的短语识别算法准确率约为70.5%,而本文提出的改进后的风险短语识别方法准确率约为80.6%,且后者识别出的风险短语构词规则更多样化。相比之下,改进后的风险短语识别方法能够识别出更多准确短语,且构成短语的词汇词性更多样化。