《表1 部分训练数据集表：基于强化学习与神经网络的动态目标分配算法》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于强化学习与神经网络的动态目标分配算法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

单步强化学习产生了1 500个训练数据样本，其中，选取1 000个样本为训练集，500个样本作为测试集；部分数据如表1所示，表中platform1表示目标与platform1的距离，依次类推。表1中的类标共8个值，其中1代表第1个火力平台的I型武器，2代表第1个火力平台的II型武器，依此类推。训练集用于对DNN-Softmax神经网络进行训练，测试集用于测试神经网络的效果。神经网络参数主要为隐藏层的层数和每一隐藏层神经元的数目。这里假设每个隐藏层的神经元的数目相同，输入层为目标的位置信息，因此，输入层有4个神经元，隐藏层我们使用10个神经元，隐藏层的数目我们采用穷举的方法隐藏层从1～4层依次观察测试集误差，找到最优的结构，输出层（Softmax回归层）为动作的预测结果即8种动作的一种，所以有8个神经元，最优结构为有2个隐藏层，每层10个神经元，迭代了4 000次。

图表编号	XD00155805400 严禁用于非法目的
绘制时间	2020.07.05
作者	丁振林、刘冠龙、谢艺、刘钦、吴建设
绘制单位	西安电子科技大学人工智能学院、中国电子科技集团公司第二十研究所人工智能实验室、吉林大学通信工程学院、32102部队、中国电子科技集团公司第二十研究所人工智能实验室、西安电子科技大学人工智能学院
更多格式	高清、无水印（增值服务）