《表3 对5组聊天记录的匹配结果》
通过对5组聊天记录进行匹配分析实验,得出的结果如表3所示。通过表中的数据可以发现,匹配到的信息有效率基本可以达到90%以上,有些甚至可以达到100%,说明匹配模式的设计精度很高,可以准确的发现涉案信息;匹配到的信息召回率可以达到80%以上,说明有部分涉案信息未被匹配,通过对未召回的信息进行分析,发现问题主要出现在相关信息中夹杂了其他分类标记,影响了模式的正常识别,可以通过修改匹配模式放宽匹配条件来提高召回率,但是相应的可能会降低匹配信息的有效率;信息压缩率均能达到6%以下,说明超过九成与案件无关的信息被过滤掉了,从而大大减少了后期人工研判的工作量,可以显著的提升办案人员对聊天记录的分析效率。同时,这一思路和方法可以拓展到其他关联目标信息分析筛选提取中,比如涉及仿真枪等某种特定称谓的标的物交易、传播淫秽视频信息的特定类型文件、分析多人之间大量往来资金情况等。
图表编号 | XD0037388000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.10 |
作者 | 孙施宁、赵广晔 |
绘制单位 | 中国刑事警察学院网络犯罪侦查系、中国刑事警察学院网络犯罪侦查系 |
更多格式 | 高清、无水印(增值服务) |