强化学习(RL)的最新发展结合深度学习(DL),在训练代理以类似人的方式解决复杂问题方面取得了前所未有的进步。Google使用算法在著名的Atari街机游戏中获胜将该领域推至高峰,研究人员也在源源不断地产生新的想法。本书是关于最新DL工具及其局限性的全面指南。在应用于真实环境之前,你得评估包括交叉熵和策略梯度在内的多种算法。试试Atari的虚拟游戏和像Connect4这样的家庭最爱。本书介绍了RL的基础知识,为你提供了编写智能学习代理所需的原理,用以承担一系列艰巨的实际任务。了解如何在“网格世界”环境中实现Q-learning,教你的代理购买和交易股票,发现自然语言模型如何推动了聊天机器人的火爆。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。