《表5 稳健性检验Ⅰ:基于数据流挖掘算法的电网设备风险识别研究》
以算法计算时间、准确率和有效时间误删除率作为对比数据,表5为三种算法的效率对比。通过观察分析发现,Euclidean cluster算法准确率只有69.80%,有效数据误删除率为5.40%,分析原因是有效数据的误删除导致数据集特征数据减少,分类准确率降低;双层窗口数据流分类算法准确率为85.10%,有效数据误删除率为0%,结合双层窗口数据流分类的运行流程分析,在进行数据流的联合分类时,在线微聚类方法不再删除聚类类别,而是进行过期数据的不断替换,以及类别的不断重划分,这避免了有效数据误删除情况,因此保证了数据流中特征数据的数量,提升了算法的准确率。对比两类算法计算时间,双层窗口数据流分类算法在保证有效数据处理的同时,运行速度有所下降,但下降的幅度很小,考虑到有效数据对于数据挖掘的重要性,因此双层窗口数据流分类算法优于Euclidean cluster算法。
图表编号 | XD00210944600 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.01 |
作者 | 田易之、邢文琦、蒋博、王龙源 |
绘制单位 | 新疆大学、国网乌鲁木齐供电公司、新疆大学、新疆大学 |
更多格式 | 高清、无水印(增值服务) |