《表1 数据集参数统计表》
实验数据采用行政、民事、赔偿、刑事、执行共五个分类的法院判决书作为数据源,数据来自山东省某法院的真实数据。每个分类有2500个文本,一共12500个文本。每个分类分出2000作为训练集,300测试集,200验证集。分类后,文本训练集、测试集、验证集分开进行整合和贴上标签,并进行预处理,去除多余的符号和不可识别的部分后。统一进行格式转换。数据集统计和整合后的各项参数见表1。
图表编号 | XD0063575900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 杨帆、陈建峡、郑吟秋、黄煜俊、李超 |
绘制单位 | 湖北工业大学计算机学院、湖北工业大学计算机学院、湖北工业大学计算机学院、湖北工业大学计算机学院、湖北工业大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |