《表1 UCI数据集:强化属性依赖关系的K阶贝叶斯分类模型》
本文从UCI机器学习数据库[24]中选取21个数据集来验证算法的性能.这些数据集的样本个数、属性个数、类标签个数各不相同,具体信息如表1所示.数据集包括离散型和连续型两种类型,其中离散型属性的缺失值由训练样本集中出现频率最多的属性值来代替,连续型属性的缺失值由训练样本集中该属性所有取值的平均值来代替.对于每个数据样本,使用MDL准则对连续型属性进行离散化预处理[25-26].
图表编号 | XD0054185600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 王利民、姜汉民 |
绘制单位 | 吉林大学计算机科学与技术学院、吉林大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |