《表3 特征类别对检测结果的影响》
为了确定特征的识别能力,本文使用组合特征和单类型的特征分别进行3组实验。第一组实验:选取所有特征(上文所述共6个特征),第二组与第三组实验分别使用了特征类别A与B,3组实验通过各自选取的特征,构建行为模型,并计算异常得分,使用决策树分类器在2.1节所述实验样本上进行分类实验。特征A(必需的模型特征):发布时间、发布源和发布消息主题;特征B(可选的模型特征):发布消息中的提及数和唯一提及数、URL和消息转发率。从表3中可以看到,当选取所有特征时,本文方法的精确率、召回率与F1-score均最高,比仅选取类别A时分别提高了1.9%、1.2%、0.016;比仅选用类别B时分别提高了5%、4%、0.044。
图表编号 | XD00139033200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.24 |
作者 | 王丽娜、柯剑鹏、叶傲霜、王文琦 |
绘制单位 | 武汉大学空天信息安全与可信计算教育部重点实验室、武汉大学国家网络安全学院、武汉大学空天信息安全与可信计算教育部重点实验室、武汉大学国家网络安全学院、武汉大学空天信息安全与可信计算教育部重点实验室、武汉大学国家网络安全学院、武汉大学空天信息安全与可信计算教育部重点实验室、武汉大学国家网络安全学院 |
更多格式 | 高清、无水印(增值服务) |