《表1:联机数据处理系统与联机分析处理系统对比表》
在进行数据挖掘操作时,模式发现是最为关键的一个环节,在面对各种类型的模式时应当要选择与之相匹配的数据分析算法。现阶段,应用较为常见的数据挖掘方式主要有频繁模式、关联与相关性挖掘模式,在这种模式下一般使用的主流算法是Apriori算法[6]。分类与回归模式的操作对象是已经明确类别的数据集,并从其中探索到数据类型划分的特征模型,并确保该模型可以很好的预测未知数据目标的类别。当下主要采用的分类方式有决策树、遗传算法以及神经网络等。聚类分析方法中需要进行分析的所有数据目标,初始时期并没有任何的分类标记,之后依托于聚类算法实现数据信息的分类。在进行数据分组过程中,需要严格按照类内最大相似度、类间最小相似度的原则进行[7]。如图2所示为聚类分析示意图,基于两点之间的欧式距离为聚类标准,将各点自动划分成三个部分。
图表编号 | XD00184728200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 王秋实 |
绘制单位 | 河南水利与环境职业学院 |
更多格式 | 高清、无水印(增值服务) |