《表5 Lattice-LSTM基于不同字符向量实验结果》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别》
Lattice-LSTM模型提供了预训练字符向量集和词向量集,字符向量gigaword_chn.all.a2b.uni.ite50.vec是基于大规模标准分词后的中文语料库Gigaword使用Word2vec工具训练的向量集合,向量集规模为704 400个字符和词,包括5 700个单字符向量、29 150个双字符向量和278 100个三字符向量。词向量ctb.50d.vec是基于CTB 6.0(Chinese Treebank 6.0)语料库训练得到的。该模型实验在保持词向量ctb.50d.vec不变的前提下分别使用gigaword_chn.all.a2b.uni.ite50.vec、nwfe_emd和unlabel_emd 3个字符向量集进行对比实验,实验结果如表5所示。
图表编号 | XD0055524700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.20 |
作者 | 潘璀然、王青华、汤步洲、姜磊、黄勋、王理 |
绘制单位 | 南通大学医学院医学信息学教研室、南通大学医学院医学信息学教研室、哈尔滨工业大学(深圳)计算机科学与技术学院、海军军医大学(第二军医大学)长征医院风湿免疫科、南通大学信息科学技术学院通讯工程教研室、南通大学医学院医学信息学教研室 |
更多格式 | 高清、无水印(增值服务) |