《表1 部分训练数据集表:基于强化学习与神经网络的动态目标分配算法》

《表1 部分训练数据集表:基于强化学习与神经网络的动态目标分配算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于强化学习与神经网络的动态目标分配算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

单步强化学习产生了1 500个训练数据样本,其中,选取1 000个样本为训练集,500个样本作为测试集;部分数据如表1所示,表中platform1表示目标与platform1的距离,依次类推。表1中的类标共8个值,其中1代表第1个火力平台的I型武器,2代表第1个火力平台的II型武器,依此类推。训练集用于对DNN-Softmax神经网络进行训练,测试集用于测试神经网络的效果。神经网络参数主要为隐藏层的层数和每一隐藏层神经元的数目。这里假设每个隐藏层的神经元的数目相同,输入层为目标的位置信息,因此,输入层有4个神经元,隐藏层我们使用10个神经元,隐藏层的数目我们采用穷举的方法隐藏层从1~4层依次观察测试集误差,找到最优的结构,输出层(Softmax回归层)为动作的预测结果即8种动作的一种,所以有8个神经元,最优结构为有2个隐藏层,每层10个神经元,迭代了4 000次。