《表2 CRF模型在不同特征设置条件下的性能》

《表2 CRF模型在不同特征设置条件下的性能》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向全文本的微观实体抽取及扩散研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

将标注文献按照10折交叉验证的方式随机分为训练集和测试集,采用一般语义特征、字符特征、大小写特征、词聚簇特征来对数据进行刻画[4],与CRF模型对比,考察Bi LSTM-CRF模型的合理性、科学性和优越性。利用CRF++,选用Unigram模板,在构造词聚簇特征时,选择500、1,000、1,500、2,000簇进行布朗(Brown)聚类[34],得到4种不同簇的特征表示。还考虑不加入词聚簇特征的情形,由此共有5种特征设置。从表2看出,加入词聚簇特征的CRF模型均优于未加入词聚簇特征的CRF模型。当聚类的簇数为500时,CRF模型的召回率、F1值效果最好,故本文将词聚簇数目设置为500。