《表1 超参数配置:基于动态融合目标的深度强化学习算法研究》

《表1 超参数配置:基于动态融合目标的深度强化学习算法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于动态融合目标的深度强化学习算法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对比算法有DQN、DSN、DTDQN三种学习算法,神经网络均为三层,输入层神经元数为环境状态维数,隐藏层神经元数设为50,输出层神经元数设置为环境动作维数,使用ReLU激活函数。强化学习算法超参数设置,如表1所示。