《表9 索引选择方法比较:人工智能赋能的查询处理与优化新技术研究综述》
针对以上索引选择存在的问题,研究人员引入机器学习方法用于索引选择。近期人工智能赋能的索引选择方法比较如表9所示。Ding等人[62]对索引选择过程中面临的关键问题,如何比较基于不同索引配置的两个计划的执行代价进行研究。研究者将问题作为三元分类任务,对给定的两个查询计划,首先提出一种编码方式将查询计划编码为维度相等的向量,然后利用分类器将代价较高的计划标记为“退化”,将代价较低的计划标记为“改进”,其他情况标记为“不确定”。Vu[63]提出使用深度神经网络建立索引选择系统。首先计算数据集的直方图矩阵并将其转化为一个向量,然后将向量输入深度神经网络模型中,模型根据索引性能预测最优的数据索引。索引的性能指标使用基于抽样的索引方法作为训练数据。Qiu等人[64]针对基于代价模型的索引选择方法无法准确估计索引的优化效果和维护代价的问题,以及无法利用数据分布的缺陷提出了一个面向关系数据库的智能索引选择系统。系统由查询分析、候选索引生成与索引选择三部分组成。其中索引选择模块使用机器学习对索引优化效果建模,计算每个候选索引的实用值,并设计递归算法选择最优索引。
图表编号 | XD00165382700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 宋雨萌、谷峪、李芳芳、于戈 |
绘制单位 | 东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |