《表2 四个语料上的新词识别结果》

《表2 四个语料上的新词识别结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《无监督分词算法在新词识别中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

同时为了衡量本文的方法在多领域、大规模语料上的可行性,将本文方法和ICTCLAS预分词方法进行对比,测试语料为5.1节中所述的四个领域的语料,语料规模为80M文本,在同一组参数下(频次阈值为52、互信息阈值为3.1、邻接熵阈值为2.2),按照排序取前10%候选词的准确率(Accuracy)进行对比结果对比如表2所示.