1 火力-目标分配问题描述
2 基于DQN算法的DWTA问题求解
2.1 Q-learning算法
表1 初始化Q表值Tab.1 Initializing Q table value |
Q表 | 动作a1 | 动作a2 | … | 动作an |
---|---|---|---|---|
状态s1 | 0 | 0 | … | 0 |
状态s1 | 0 | 0 | … | 0 |
… | … | … | … | … |
状态sm | 0 | 0 | … | 0 |
表2 迭代后Q表值Tab.2 Q table value after iteration |
Q表 | 动作a1 | 动作a2 | … | 动作an |
---|---|---|---|---|
状态s1 | 3.6 | -5.3 | … | 3.2 |
状态s2 | 5.4 | 2.5 | … | -1.1 |
… | … | … | … | … |
状态sm | 2.1 | 3.6 | … | -4.3 |
2.2 DQN算法描述
2.3 DQN-DWTA算法设计
2.4 算法描述
3 改进算法性能测试及分析
表3 深度强化学习模型算法测试环境与输入、输出参数Tab.3 Deep reinforcement learning model algorithm test environment and input and output parameters |
测试环境 | Windows 10专业版21H1 |
---|---|
编程语言 | Python 3.7 |
编程框架 | PyTorch 1.11 |
输入参数 | 连续状态值 (毁伤效果、命中概率、弹药消耗量、目标威胁程度) |
输出参数 | 离散动作值(目标分配策略) |
性能比较值 | 回报值 |
图7 基于DQN的深度强化学习算法迭代信息输出Fig.7 Iterative information output of deep reinforcement learning algorithm based on DQN |
表4 毁伤效果指标/%Tab.4 Damage effect index/% |
弹药目标 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
A | 66 | 76 | 65 | 71 | 72 | 75 | 78 | 52 | 85 |
B | 64 | 66 | 82 | 72 | 51 | 42 | 78 | 85 | 61 |
C | 61 | 82 | 75 | 43 | 45 | 79 | 78 | 82 | 82 |
D | 79 | 66 | 54 | 68 | 80 | 61 | 82 | 45 | 48 |
E | 75 | 75 | 78 | 89 | 55 | 75 | 78 | 88 | 84 |
表5 命中率/%Tab.5 Hit rate/% |
弹药目标 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
A | 58 | 62 | 67 | 56 | 61 | 80 | 70 | 74 | 81 |
B | 76 | 58 | 75 | 60 | 63 | 78 | 72 | 66 | 70 |
C | 62 | 67 | 75 | 78 | 89 | 79 | 78 | 65 | 70 |
D | 66 | 56 | 53 | 66 | 80 | 77 | 82 | 71 | 75 |
E | 63 | 78 | 60 | 60 | 65 | 78 | 78 | 84 | 83 |
表6 弹药消耗量/%Tab.6 Ammunition consumption/% |
弹药目标 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|
A | 55 | 84 | 77 | 66 | 57 | 78 | 82 | 66 | 80 |
B | 61 | 76 | 84 | 82 | 85 | 82 | 74 | 83 | 67 |
C | 74 | 56 | 65 | 70 | 78 | 56 | 65 | 76 | 76 |
D | 83 | 64 | 56 | 77 | 62 | 65 | 56 | 52 | 56 |
E | 90 | 72 | 85 | 84 | 70 | 85 | 56 | 84 | 71 |
表7 目标威胁程度/%Tab.7 Target Threat/% |
目标 | A | B | C | D | E |
---|---|---|---|---|---|
威胁程度 | 55 | 77 | 86 | 67 | 88 |