《表1 数据集参数统计表》

《表1 数据集参数统计表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的法院信息文本分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验数据采用行政、民事、赔偿、刑事、执行共五个分类的法院判决书作为数据源,数据来自山东省某法院的真实数据。每个分类有2500个文本,一共12500个文本。每个分类分出2000作为训练集,300测试集,200验证集。分类后,文本训练集、测试集、验证集分开进行整合和贴上标签,并进行预处理,去除多余的符号和不可识别的部分后。统一进行格式转换。数据集统计和整合后的各项参数见表1。