《数据流机器学习 MOA实例》求取 ⇩

第一部分概述2

第1章简介2

1.1大数据2

1.1.1工具:开源革命4

1.1.2大数据带来的挑战4

1.2实时分析6

1.2.1数据流6

1.2.2时间和内存6

1.2.3应用一览6

1.3关于本书7

第2章大数据流挖掘8

2.1算法8

2.2分类算法9

2.2.1如何在数据流中评估分类器10

2.2.2多数类分类器11

2.2.3无变化分类器11

2.2.4惰性分类器11

2.2.5朴素贝叶斯分类器12

2.2.6决策树分类器12

2.2.7集成分类器13

2.3回归算法13

2.4聚类算法14

2.5频繁模式挖掘14

第3章MOA的实际操作介绍16

3.1入门开始16

3.2分类模型的图形用户界面18

3.3用命令行操作23

第二部分数据流挖掘26

第4章数据流和Sketch数据结构26

4.1背景知识:近似算法27

4.2集中不等式28

4.3取样30

4.4统计总数31

4.5去重统计32

4.5.1线性计数33

4.5.2科恩对数计数器33

4.5.3Flajolet-Martin计数器和HyperLogLog算法34

4.5.4应用:图论的计算距离函数36

4.5.5讨论:对数与线性37

4.6频率问题37

4.6.1SpaceSaving sketch38

4.6.2 CM-Sketch算法40

4.6.3 CountSketch算法42

4.6.4时刻计算44

4.7滑动窗口的指数矩形图45

4.8分布式sketch计算的可合并性47

4.9一些技术方面的讨论和其他资料48

4.9.1哈希函数48

4.9.2创建(ε,δ)近似算法49

4.9.3其他sketch技术49

4.10练习50

第5章处理变化52

5.1数据流中变化的定义52

5.2评估器56

5.2.1滑动窗口和线性评估器57

5.2.2指数加权移动平均评估器57

5.2.3单维度卡尔曼滤波器58

5.3变化探测58

5.3.1评估变化探测59

5.3.2CUSUM 测试和Page-Hinkley测试59

5.3.3统计测试60

5.3.4漂移探测法61

5.3.5自适应滑动窗口算法62

5.4与其他Sketch和多维数据结合64

5.5练习64

第6章分类66

6.1分类器评估67

6.1.1误差估算68

6.1.2分布评估69

6.1.3性能的评估测量70

6.1.4统计显著性72

6.1.5测量挖掘成本73

6.2基线分类器73

6.2.1多数类73

6.2.2无变化分类器74

6.2.3朴素贝叶斯74

6.2.4多项式朴素贝叶斯77

6.3决策树78

6.3.1估算切分标准79

6.3.2Hoeffding决策树80

6.3.3 CVFDT82

6.3.4 VFDTc和UFFT83

6.3.5 Hoeffding适应树84

6.4处理数字属性85

6.4.1VFML85

6.4.2穷举二叉树86

6.4.3 Greenwald和Khanna的分位数摘要86

6.4.4高斯近似87

6.5感知器模型88

6.6惰性学习89

6.7多标签分类器89

6.8主动学习91

6.8.1随机策略92

6.8.2固定不确定策略93

6.8.3可变不确定策略93

6.8.4随机不确定策略94

6.9概念演变94

6.10MOA实战操作95

第7章集成方法99

7.1准确率加权集成99

7.2加权多数算法100

7.3堆叠算法102

7.4装袋算法102

7.4.1在线装袋算法103

7.4.2装袋算法如何应对数据流变化103

7.4.3杠杆装袋算法103

7.5提升算法104

7.6Hoeffding树集成算法105

7.6.1 Hoeffding选项树算法105

7.6.2随机森林算法105

7.6.3有限的Hoeffding树的感知器堆叠106

7.6.4自适应大小的Hoeffding树算法107

7.7重复性概念107

7.8 MOA实战操作108

第8章回归110

8.1什么是回归110

8.2如何评估回归111

8.3感知器学习112

8.4惰性学习112

8.5决策树学习112

8.6决策规则113

8.7 MOA中的回归114

第9章聚类115

9.1聚类的评估方法116

9.2 k-means算法117

9.3 BIRCH、BICO和CluStream118

9.4基于密度的方法:DBSCAN和Den-Stream120

9.5 ClusTree121

9.6 StreamKM++:核心集122

9.7延伸阅读123

9.8 MOA实战操作124

第10章频繁模式挖掘127

10.1什么是模式挖掘127

10.1.1模式的定义和例子127

10.1.2频繁模式挖掘的批量算法129

10.1.3闭合模式和最大模式131

10.2数据流中频繁模式挖掘的方法131

10.3如何在数据流中进行频繁项集挖掘134

10.3.1简化为高频繁项134

10.3.2Moment算法135

10.3.3频繁模式数据流算法135

10.3.4 IncMine算法136

10.4数据流的频繁子图挖掘137

10.4.1WinGraphMiner框架138

10.4.2 AdaGraphMiner框架139

10.5延伸阅读140

10.6练习141

第三部分MOA软件144

第11章MOA及其软件体系144

11.1MOA架构145

11.2安装145

11.3 MOA的近期发展145

11.4 MOA扩展包146

11.5 ADAMS优化147

11.6 MEKA优化149

11.7 OpenML环境150

11.8 StreamDM软件150

11.9 Streams工具151

11.10 Apache SAMOA流媒体ML库151

第12章图形用户界面154

12.1初识图形用户界面154

12.2分类和回归154

12.2.1主要任务一览156

12.2.2数据源和数据生成器157

12.2.3贝叶斯分类器一览160

12.2.4决策树一览160

12.2.5元分类器(集成)一览161

12.2.6函数分类器一览162

12.2.7漂移分类器一览162

12.2.8主动学习分类器163

12.3聚类163

12.3.1数据源和数据生成器163

12.3.2数据流聚类算法一览163

12.3.3如何进行可视化和数据分析164

第13章用命令行操作166

13.1给分类和回归创建学习任务166

13.2给分类和回归创建评估任务167

13.3给分类和回归创建学习与评估任务167

13.4两种分类器的对比168

第14章调用API170

14.1 MOA对象170

14.2选项170

14.3示例:先序评估173

第15章在MOA中开发新的方法175

15.1MOA中的主要类175

15.2创建新的分类器176

15.3编译分类器183

15.4 MOA中的良好编程方法183

参考文献185

2020《数据流机器学习 MOA实例》由于是年代较久的资料都绝版了,几乎不可能购买到实物。如果大家为了学习确实需要,可向博主求助其电子版PDF文件。对合法合规的求助,我会当即受理并将下载地址发送给你。

高度相关资料

计算机数据显示器(1977 PDF版)
计算机数据显示器
1977 北京:科学出版社
机器学习与r语言实战( PDF版)
机器学习与r语言实战
从实践中学习WIRESHARK数据分析(2020 PDF版)
从实践中学习WIRESHARK数据分析
2020
PYTHON极简讲义  一本书入门数据分析与机器学习(2020 PDF版)
PYTHON极简讲义 一本书入门数据分析与机器学习
2020
GO语言机器学习实战(2020 PDF版)
GO语言机器学习实战
2020
机器学习算法的数学解析与Python实现(2020 PDF版)
机器学习算法的数学解析与Python实现
2020
快乐机器学习(2020 PDF版)
快乐机器学习
2020
全球信息社会发展报告(2020 PDF版)
全球信息社会发展报告
2020 北京:社会科学文献出版社
民用微电机原理与设计( PDF版)
民用微电机原理与设计
电器  电机检修实习(1996 PDF版)
电器 电机检修实习
1996 北京:中国电力出版社
实变函数例题习题集(1991 PDF版)
实变函数例题习题集
1991 济南:山东教育出版社
实用无机物热力学数据手册(1981 PDF版)
实用无机物热力学数据手册
1981 北京:冶金工业出版社
数据结构例解(1983 PDF版)
数据结构例解
1983 上海:上海科学技术文献出版社
Visual FoxPro 5.0数据库开发实例(1998 PDF版)
Visual FoxPro 5.0数据库开发实例
1998 北京:人民邮电出版社
中华学习机数据处理(1989 PDF版)
中华学习机数据处理
1989 北京:气象出版社