《表2 四个语料上的新词识别结果》
同时为了衡量本文的方法在多领域、大规模语料上的可行性,将本文方法和ICTCLAS预分词方法进行对比,测试语料为5.1节中所述的四个领域的语料,语料规模为80M文本,在同一组参数下(频次阈值为52、互信息阈值为3.1、邻接熵阈值为2.2),按照排序取前10%候选词的准确率(Accuracy)进行对比结果对比如表2所示.
图表编号 | XD00141275300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 姜涛、陆阳、张洁、洪建 |
绘制单位 | 合肥工业大学计算机与信息学院、合肥工业大学计算机与信息学院、安全关键工业测控技术教育部工程研究中心、安徽医科大学第一附属医院信息中心、安徽医科大学第一附属医院信息中心 |
更多格式 | 高清、无水印(增值服务) |