《表1 工作时间的离散化:电能表故障预测的代价敏感模型研究》
实际数据中的数值型数据取值通常呈现出不均匀的长尾分布,将其离散化后作为有序的类别处理往往能使模型具有更好的效果。对于树模型,离散化的一大优点是使模型在训练中无需经过复杂的计算选择分割点,从而加速训练过程[15-16]。离散化的主要步骤是选择分割点的个数并确定分割点的位置,结果可以用分割点集{(x0,x1],(x1,x2],…,(xn-1,xn]}表示,其中x0可以取-∞,且xn可以取+∞。以设备工作时间为例,将这一属性离散化为10个区间,如表1所示。
图表编号 | XD00191680300 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.15 |
作者 | 张璨辉、赵丹、贺星、樊芮、徐慧婷 |
绘制单位 | 国家电网湖南省电力公司、国家电网湖南省电力公司、国家电网湖南省电力公司、国家电网湖南省电力公司、国家电网湖南省电力公司 |
更多格式 | 高清、无水印(增值服务) |