《表6 模型最优参数表:基于实体关联的消歧算法研究》
对于GBDT模型,RF模型,XGBOOST模型,最大迭代次数n_estimators以10为步长,范围[10,500]和最大树深度max_depth以5为步长,范围[5,30],即总共300组参数,同时内部节点再划分所需最小样本数min_samples_split为2,叶子结点最小样本数min_samples_leaf为1,其他参数默认,进行训练;对于NB模型,采用平滑因子alpha以0.001为步长,范围[0.001,1],即总共1000组参数,其他参数默认,进行训练;对于Tree模型,采用特征选择标准criterion为’gini’,即CART算法,最大迭代次数n_estimators以10为步长,范围[10,500],即总共50组参数,同时内部节点再划分所需最小样本数min_samples_split为2,叶子结点最小样本数min_samples_leaf为1,其他参数默认,进行训练。如表6所示为最优解时的各个模型的参数。
图表编号 | XD00164977500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.20 |
作者 | 周国民、宣鑫乐、沈佳琪、陈光宣 |
绘制单位 | 浙江警察学院、杭州三汇数字信息技术有限公司、杭州电子科技大学、浙江警察学院、浙江工业大学、浙江警察学院 |
更多格式 | 高清、无水印(增值服务) |