《表2 故意伤害罪词袋模型示例》

《表2 故意伤害罪词袋模型示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的司法数据分析及建模研究——以“故意伤害罪”为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

不同于普通的语料库数据,贵州法院故意伤害罪案件数据以虚拟编号的形式存储,其字典示例见表1。为了让计算机能够理解这类数据,采用了词袋模型对数据进行有效编码,其结果见表2,得到一个5 348×78的特征矩阵。表2中列表示案件要素,1表示该案件中存在该要素,0表示不存在。词袋模型完成了对原始故意伤害罪案件文本要素到文本向量空间的映射。