《表1 值函数神经网络结构参数》

《表1 值函数神经网络结构参数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《非对称机动能力多无人机智能协同攻防对抗》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文中使用多层神经网络作为第i架无人机的确定性策略函数μiθ,即策略神经网络。策略神经网络为主神经网络,输出为无人机当前状态下的动作。为贴近现实环境,在训练时利用无人机自身的目标策略神经网络来估计其他无人机的行为策略,即目标策略神经网络的输出为各个无人机在当前状态的下一状态时的动作。如图7所示,执行模块的神经网络结构与评判模块的神经网络结构相似,结构参数与值函数神经网络相同(见表1),其中输入为单个无人机的观测量,输出为无人机的具体动作。