《表2 平均得分和标准差:基于动态融合目标的深度强化学习算法研究》
进一步对几种深度强化学习算法的实验得分进行显著性检验,显著性水平设置为α=0.05,SDQN为DQN算法的平均奖励值,SDSN为DSN算法的平均奖励值,SDTDQN为DTDQN算法的平均奖励值。如表4所示,对DTDQN算法的检验均拒绝原假设,接受备择假设,DTDQN算法在平均得分方面,相比较DQN算法以及DSN算法而言有较大提升,检验结果显著,进一步表明DTDQN算法有着更优的实验性能。
图表编号 | XD0035455600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.01 |
作者 | 徐志雄、曹雷、张永亮、陈希亮、李晨溪 |
绘制单位 | 解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院、解放军陆军工程大学指挥信息系统学院 |
更多格式 | 高清、无水印(增值服务) |