《表2 不同算法收敛精度及速度对比》

《表2 不同算法收敛精度及速度对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度强化学习的软件定义卫星姿态控制算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

总体统计结果如表2所示,结果表明,仅使用更深层的网络对于动力学模型精度提升有限,且增加了系统的计算量。而使用基于目标网络的算法能够显著提高动力学网络的平均收敛精度,尤其是均值和最小值,均值平均收精度从0.913提升到0.448,最小值平均收精度从0.745提升到0.014。此外,经过并行化的进化策略也使得收敛速度提高了10倍左右,大大提升了算法的在线运行能力。