《表1 预测下一执行活动结果》
为了衡量数据集上所有活动的预测性能,这里采用了Micro-F1分数衡量.在类别分布不均匀的情况下,更合适使用Micro-F1作为衡量指标.实验中针对每个活动,使用了准确率、召回率、精准率、F1分数作为衡量标准.实验中互信息阈值为4,选择的近邻点数量为5,得到了最优的预测结果.图4展示了出现频率最高的4个活动的准确率、召回率、精准率和F1分数.表1展示了所有活动的F1分数.可以看到,所提出的算法在各个标准上均比基线算法有所提高.表2展示了不同的K值对于预测结果的影响,并且值为5预测效果最佳.
图表编号 | XD00100119900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 黄晓芙、曹健、谭煜东 |
绘制单位 | 上海交通大学计算机科学与工程系、上海交通大学计算机科学与工程系、携程(上海)计算机技术有限公司 |
更多格式 | 高清、无水印(增值服务) |