《表2 非平衡处理后的投诉及非投诉数据分布Tab.2 Imbalance data processing of complaints and non-complaint data distributi
本文使用R语言DMw R包中的SMOTE函数,对非平衡数据进行数据处理,通过将SMOTE函数中的参数perc.over设置为600,perc.under参数的值设置为100,从而将少数类的数量变成原来的7倍,多数类样本变为少数类样本的6倍。非平衡处理后的投诉及非投诉数据分布见表2所列。
图表编号 | XD0016520300 严禁用于非法目的 |
---|---|
绘制时间 | 2018.08.01 |
作者 | 朱龙珠、宫立华、刘鲲鹏、杨菁、赵强 |
绘制单位 | 国家电网客服中心、国家电网客服中心、国家电网客服中心、国家电网客服中心、北京数洋智慧科技有限公司 |
更多格式 | 高清、无水印(增值服务) |