从与环境交互中学习是人类获取知识的主要方法,也是人类提高智能水平的基本途径。人类智能研究的一个最核心问题就是构建具有类似人类智能的系统。该系统的一个主要特征就是能够适应未知环境,并逐渐增强其自身能力。本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括:强化学习基本理论和大规模强化学习基本理论。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。