《表3 FEC-DDPG算法测试数据表》
为判断模型训练结果,训练过程中,每5轮对学习到的策略网络进行一次测试,测试地图为原地图,圈数为10圈,FEC-DDPG算法在训练270轮后,能较好地完成测试,测试结果如表3所示。DDPG算法需要350轮训练才能达到同等训练效果,DQN算法需要460轮左右能达到同等训练效果。
图表编号 | XD0053261900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.15 |
作者 | 张斌、何明、陈希亮、吴春晓、刘斌、周波 |
绘制单位 | 中国人民解放军陆军工程大学指挥控制工程学院、中国人民解放军陆军工程大学指挥控制工程学院、军事科学院系统工程研究院网络信息研究所、中国人民解放军陆军工程大学指挥控制工程学院、中国人民解放军陆军工程大学指挥控制工程学院、中国人民解放军陆军工程大学指挥控制工程学院、中国人民解放军陆军工程大学指挥控制工程学院 |
更多格式 | 高清、无水印(增值服务) |