《表2 不平衡分类数据分组方法》

《表2 不平衡分类数据分组方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于词向量预训练的不平衡文本情绪分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文首先对数据集分组,从最小类别开始将该类别样本数3倍以内的类别归入该分组,再从剩余类别中重复上述操作直至无剩余数据。此时认为分组间具有数据不平衡问题,而组内不平衡问题较弱。若所有类别样本被分至同一组,则缩小倍数重新分组。当降至2倍时仍然仅有单一分组则认为数据相对平衡,分组伪代码如表2所示。