《表3 降维后的样本数据集》

《表3 降维后的样本数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《朴素贝叶斯算法在反恐情报分类中的应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

经典的朴素贝叶斯分类器可以对连续属性进行精确的计算,但在本样本中,对于“年龄”一栏属性来说,较小的年龄差异对涉恐等级的判定影响并不大。对此,我们采取离散化的方法,将连续的年龄划分为几个离散区间。在本方法中,以20岁、60岁为离散点,划分为青少年(0,20]、中壮年(20,60]、老年(60岁以上)3个区间。在实际应用中,还可以通过调整区间分段来优化算法结构。另外,为提高分类准确度,可根据常识和反恐经验过滤掉过大或过小年龄段,例如,6岁以下的儿童和80岁以上的老人几乎不会单独实施暴力恐怖活动,这部分人可以过滤掉。再例如,涉恐人员的姓名并不是涉恐等级的相关属性,人员的“性别”属性与“特殊外貌”属性并不是相互独立的特征,而是存在一定的关联性。在进行预处理时,也可以考虑将上述属性过滤掉。一般情况下,蒙面的、穿“吉里巴甫”服的多为女性[16]。进行特征降维后的样本数据集如表3所示。