《表1 部分训练数据集表:基于强化学习与神经网络的动态目标分配算法》
单步强化学习产生了1 500个训练数据样本,其中,选取1 000个样本为训练集,500个样本作为测试集;部分数据如表1所示,表中platform1表示目标与platform1的距离,依次类推。表1中的类标共8个值,其中1代表第1个火力平台的I型武器,2代表第1个火力平台的II型武器,依此类推。训练集用于对DNN-Softmax神经网络进行训练,测试集用于测试神经网络的效果。神经网络参数主要为隐藏层的层数和每一隐藏层神经元的数目。这里假设每个隐藏层的神经元的数目相同,输入层为目标的位置信息,因此,输入层有4个神经元,隐藏层我们使用10个神经元,隐藏层的数目我们采用穷举的方法隐藏层从1~4层依次观察测试集误差,找到最优的结构,输出层(Softmax回归层)为动作的预测结果即8种动作的一种,所以有8个神经元,最优结构为有2个隐藏层,每层10个神经元,迭代了4 000次。
图表编号 | XD00155805400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.05 |
作者 | 丁振林、刘冠龙、谢艺、刘钦、吴建设 |
绘制单位 | 西安电子科技大学人工智能学院、中国电子科技集团公司第二十研究所人工智能实验室、吉林大学通信工程学院、32102部队、中国电子科技集团公司第二十研究所人工智能实验室、西安电子科技大学人工智能学院 |
更多格式 | 高清、无水印(增值服务) |