《表7 对抗平均任务完成时间步数(MCT)》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《强化学习方法在通信拒止战场仿真环境中多无人机目标搜寻问题上的适用性研究》
综合上述实验结果,我们可以发现,DQN在3项指标中都表现最好,L-QL效果次之,DPPO表现最差.因此,在已实验的几种强化学习算法中,我们认为DQN的表现是最优的.
图表编号 | XD00137020100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.20 |
作者 | 汪亮、王文、王禹又、侯松林、乔裕哲、吴天珩、陶先平 |
绘制单位 | 南京大学计算机软件新技术国家重点实验室、南京大学计算机软件新技术国家重点实验室、南京大学计算机软件新技术国家重点实验室、南京大学计算机软件新技术国家重点实验室、南京大学计算机软件新技术国家重点实验室、南京大学计算机软件新技术国家重点实验室、南京大学计算机软件新技术国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |