《表1 BIO字标签类别:基于BiLSTM-CRF的司法领域实体识别研究》

《表1 BIO字标签类别:基于BiLSTM-CRF的司法领域实体识别研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BiLSTM-CRF的司法领域实体识别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文实验数据集来自从裁判文书网上下载的1000份裁判文书,主要包括减刑案件、假释案件以及暂予监外案件三种案件的裁判文书,我们将其中600份裁判文书作为训练集,200份作为验证集,200份作为测试集。首先,将1000份裁判文书规范格式,去掉空格,然后在法学专家的帮助下利用语料标注工具YDEEA将裁判文书标记为BIO字标签形式作为模型的输入。在本文中,我们定义了5类实体类别(姓名,地点,司法单位,案卷编号,犯罪类型)以及11类字标签,如表1所示。