《表7 训练集与测试集混淆矩阵》

《表7 训练集与测试集混淆矩阵》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《P2P网络借贷平台风险防控机制和预警体系——基于信用中介化与流动性风险视角》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

该模型是基于昆兰(Quinlan)于1986年提出的ID3和1993年提出的C4.5两种方法的改进算法,比ID3和C4.5算法具有更好的抗噪声性能[12],并且已经在统计领域和数据挖掘领域普遍使用。它采用与传统统计学完全不同的方式构建预测准则,以二叉树的形式给出,很容易理解、使用和解释。在很多情况下,由CART模型构建的预测树比传统的统计方法构建的代数学模型预测准则更加准确,而且数据越复杂、变量越多,算法就显得更优越(6),模型的关键在于预测准则的构建。这里采用python机器学习库sklearn中的决策树CART算法对样本进行分析。从本地导入train.csv和test.csv分别作为训练样本和测试样本,并从训练样本和测试样本中分别提取出自变量和因变量X_train,X_test,y_train和y_test(都是向量形式),得出训练集和测试集上的混淆矩阵(参见表7)。