《表1 实体类别及标注方法》

《表1 实体类别及标注方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BI-LSTM-CRF的作战文书命名实体识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

首先采用中科院开发的NLPIR-ICTCLAS中文分词工具实现对作战文书的分词处理,使用Google开源的Word2Vec工具生成词向量模型,而后以人工方式对训练集的命名实体进行标注。在标注阶段,以分词结果作为最小标注粒度,使用“BIO”策略进行标注。其中,B表示命名实体的开始,I表示实体内部及结尾,O表示非实体部分。根据预先准备的原始文本,选择标注5类命名实体,标注方法如表1所示。