《表1 Q-table表格》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于TensorFlow的Q-Learning算法研究与实现》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

Q-Learning算法[3]是一种基于值的算法，Q-table和Q（s，a）函数是该算法的核心。Q-table是一张存储Q值的表格，用于指导智能体的行动，它的每一列代表一个动作，每一行表示一个状态。Q（s，a）函数又称动作值函数（action-value function），用于计算在s状态执行了a行为后的期望奖励数值，计算所得即Q值最终完成Q-table单元格的填充。具体Q（s，a）函数公式如式（1)，Q-table表格如表1。

图表编号	XD00112672400 严禁用于非法目的
绘制时间	2019.10.15
作者	刘俊利
绘制单位	西南科技大学计算机科学与技术学院
更多格式	高清、无水印（增值服务）