《表3 不同算法训练得到的预测模型的性能比较》
首先,实验在测试数据上利用3种方法训练出来的模型进行了预测测试,实验结果见表3中第1行数据所示.DNN的模型获得了最低的相对错误率,仅为32.6%;LR的模型的错误率最高,达到了53.1%.实验进一步比较了不同模型用于索引调优时的效果,测试所用数据库实例大小为1GB,SmartIndex设置的索引大小阈值B为300MB.实验结果显示:由于DNN的模型具有最高的预测准确率,因此使用该模型进行索引调优后获得了最大的吞吐量.此外,虽然LR与GDBT模型的错误率要明显高于DNN的错误率,但利用该模型取得的TPS差距却要小一些.例如,在PrimarySetting1下,利用LR与DNN的方法取得TPS最大差距也仅有24.5%.出现该现象的原因是:不同的查询与索引利用同一预测模型后得到的目标值都会存在一定误差,但不同索引估计得到的实用值间的相对关系却是正确的.因此,利用本文所提出的索引选择方法(见第4节)仍能选择出有效的索引组合.
图表编号 | XD00168925300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 邱涛、王斌、舒昭维、赵智博、宋子文、钟延辉 |
绘制单位 | 东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、华为技术有限公司成都研究所 |
更多格式 | 高清、无水印(增值服务) |