《表2 非平衡数据抽样处理》

《表2 非平衡数据抽样处理》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据挖掘的网络众筹模式下用户参与动机研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:挂号内为该类别所占总计的百分比。

数据挖掘技术中解决分类问题的模型众多,经典的分类算法有朴素贝叶斯、K-近邻算法、决策树等。在集成学习的框架下,通过多个弱分类器的组合优化可得到强分类器,根据弱分类器间是否有依赖关系,可分为Bagging算法和Boosting算法,前者存在强依赖关系,其中较经典的拓展就是随机森林模型;后者的弱分类器间是串行关系,典型算法是Xgboost分类。以是否参与过众筹作为二分类响应变量,根据构造的4个新数据集分别构建决策树、随机森林、Xgboost和支持向量机模型,以特异性、敏感度、准确率、AUC曲线等量化指标作为调节参数,并用来评价分类器性能。