1 无人机近距空战模型
1.1 问题描述
1.2 无人机近距空战模型
2 基于深度强化学习算法的无人机空战决策算法
2.1 基于Markov决策过程的无人机机动模型
2.2 基于SAC算法的无人机空战决策算法
3 仿真验证与分析
3.1 不同作战环境下训练的效果对比
表1 红蓝双方初始态势设置 |
环境编号 | 初始相对距离/km | 初始相对方位角/° |
---|---|---|
1 | 12.64 | 47.35 |
2 | 12.25 | 170.30 |
3 | 14.91 | 96.63 |
表2 算法训练结果 |
环境编号 | 环境1 | 环境2 | 环境3 | |||
---|---|---|---|---|---|---|
算法 | TD3 | SAC | TD3 | SAC | TD3 | SAC |
是否作战成功 | 是 | 是 | 是 | 是 | 否 | 是 |
作战成功步长 | 316 | 314 | 506 | 492 | × | 444 |
最大奖励 | 888.13 | 890 | 436.09 | 458.58 | × | 658.53 |
奖励收敛回合 | 1 100 | 400 | 1 400 | 1 300 | × | 650 |
3.2 单一作战环境测试
表3 环境2中作战双方的初始信息 |
X坐标 /km | Y坐标 /km | Z坐标 /km | 俯仰 角/° | 航向 角/° | 初始距 离/km | 初始相对 方位角/° | |
---|---|---|---|---|---|---|---|
红方 | -2 | 3 | 4 | 2 | 120 | 12.247 | 170.30 |
蓝方 | 5 | 4 | -6 | 1 | -30 |