《表2 无人机奖励规则:深度强化学习在室内无人机目标搜索中的应用》
无人机在搜索过程中,奖励规则如下:如果无人机进入某一标注区域,该标注区域访问次数加1,若该区域访问次数等于1,则无人机获得奖励0.000 1分,若该区域访问次数大于1,则得到惩罚0.01分,无人机两次在同一区域,视为无动作,该区域访问次数依旧加1,并接受惩罚;无人机撞墙或是撞到障碍物,都接受惩罚;为了最快到达搜索目标,无人机每走一步也接受惩罚。无人机奖励规则见表2。
图表编号 | XD00150166800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.01 |
作者 | 赖俊、饶瑞 |
绘制单位 | 陆军工程大学指挥控制工程学院、陆军工程大学指挥控制工程学院 |
更多格式 | 高清、无水印(增值服务) |