《表1 超参数配置:基于动态融合目标的深度强化学习算法研究》
对比算法有DQN、DSN、DTDQN三种学习算法,神经网络均为三层,输入层神经元数为环境状态维数,隐藏层神经元数设为50,输出层神经元数设置为环境动作维数,使用ReLU激活函数。强化学习算法超参数设置,如表1所示。
图表编号 | XD0035455500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.01 |
作者 | 徐志雄、曹雷、张永亮、陈希亮、李晨溪 |
绘制单位 | 解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院 |
更多格式 | 高清、无水印(增值服务) |