1 基于DBN的单机对抗空战决策模型
表1 观测节点状态集定义 |
| 变量 | 描述 | 状态集 |
|---|---|---|
| ATA | 目标方位角 | FL1 FL2 FR1 FR2 BL1 BL2 BR1 BR2 |
| TAE | 我对敌方位角 | RAZ1 RAZ2 RAZ3 |
| RH | 目标相对高度 | A O B |
| TD | 目标距离 | L(TD>10.0km)C(TD<10.0km) |
| RSP | 敌我雷达 相对性能 | BETTER(优势)BALANCE(均势) DISA(劣势)NSU(不确定) |
| TCV | 接近速度 | CT(接近)AF(远离) |
| TDR | 雷达探测结果 | CAPTURE(捕获)LOSE(丢失) |
| WD | 武器配置 | RALM(远距弹)NALM(近距弹) HNAA(无配置弹药) |
| WR | 武器射程 | ROTB(射程均势) SUPR(射程优于敌机) WEAKR(射程弱于敌机) |
| MC | 机动约束 | HR(高度限制)SL(速度限制) CL(碰撞限制)NL(无限制) |
| TS | 威胁状态 | LOCKED(被锁定)NULL(无威胁) LEAVE(导弹离梁) ALARM(导弹来袭告警) |
| SFC | 火控雷达状态 | TRACE(跟踪)LOCK(锁定) LOSE(丢失)HIT(命中) CAPTURE(捕获) |
表2 中间节点状态集定义 |
| 变量 | 描述 | 状态集 |
|---|---|---|
| TB | 目标方位高度 | TB=ATA*RH=(ata,rh)8×3 ata∈ATA,rh∈RH |
| TSD | 目标占位 | TSD=TB*TD=(tb,td)24×2 tb∈TB,td∈TD |
| TSS | 空间态势 | TSS=TSD*TCV=(tsd,tcv)48×2 tsd∈TSD,tcv∈TCV |
| EDP | 目标探测 性能 | EDP=TD*RSP*TAE=(td,rsp,tae)2×4×3 td∈,TD,rsp∈RSP,tae∈TAE |
| TIN | 信息态势 | TIN=EDP*TDR=(edp,tdr)3×2 edp∈EDP,tdr∈TDR |
| WS | 武器状态 | WS=WD*WR=(wd,wr)3×3 wd∈WD,wr∈WR |
| SDF | 综合态势 | SDF=BS*TRH*ATC=(bs,trh,atc)5*3*3 BS={FR,FL,RS,LS,BR,BL} ATC={AT,UAT,UAC} bs∈BS,trh∈TRH,atc∈ATC |
表3 决策节点状态集定义 |
| 变量 | 描述 | 状态集 |
|---|---|---|
| DR | 决策结果 | AM(规避导弹) DRM(筒滚机动) HSM(高速机动) CTRC(右急转爬升) LSM(低速机动) HMW(盘旋机动) TR(右转弯) LAC(大迎角爬升) TL(左转弯) CTR(右盘旋急转) HRM(掉头) CTL(左盘旋急转) TRD(右转俯冲) CTLC(左急转爬升) TLD(左转俯冲) TRC(右转爬升) TLC(左转爬升) QTF(退出战斗) |
2 决策模型推理算法
2.1 前向递归推理算法
| Step 1初始化网络节点的状态集维数,加载先验分布、条件概率分布和状态转移概率。设定网络推理周期的迭代次数为n。 Step 2根据链式规则和条件独立性假设,依据从观测节点采集到的当前证据信息计算决策节点分布P(DRt|et)。 Step 3依据贝叶斯定理,使用P(DRt|et)计算条件概率分布P(et|DRt)。 Step 4根据P(et|DRt)、状态转移概率P(DRt|DRt-1)和上一时刻迭代推理结果P(DRt-1|e1:t-1),由式(1)计算累积证据信息下的决策节点概率分布P(DRt|e1:t),完成一次迭代推理。 Step 5记录迭代次数,并保存P(DRt|e1:t),以备更新下一时刻决策节点的推理结果。 Step 6判断是否完成n次递归推理,若未完成转至Step2,否则转至Step7。 Step 7输出DR节点中概率最大的机动决策结果,重置网络,重复执行Step1到Step7。 |
2.2 算法复杂度分析
表4 各条链路算法复杂度 |
| 链路 | 乘法次数 | 加法次数 | 除法次数 |
|---|---|---|---|
| P(DR|TAZ) | 21780 | 10890 | 10890 |
| P(DR|TRH) | 21780 | 10890 | 10890 |
| P(DR|TD) | 21120 | 10560 | 10560 |
| P(DR|RSP) | 2004 | 1002 | 1002 |
| P(DR|EAZ) | 2004 | 1002 | 1002 |
| P(DR|TCV) | 10260 | 5130 | 5130 |
| P(DR|TDR) | 1170 | 585 | 585 |
| P(DR|WD) | 1170 | 585 | 585 |
| P(DR|WR) | 1170 | 585 | 585 |
| P(DR|MC) | 18 | 0 | 18 |
| P(DR|TS) | 18 | 0 | 18 |
| P(DR|SFC) | 18 times | 0 times | 18 times |
| in total | 82512 times | 41256times | 41256times |
3 仿真与分析
表5 初始态势信息 |
| 经度/ (°) | 纬度/ (°) | 海拔高度/ m | 空速/ (m/s) | 航向/ (°) | |
|---|---|---|---|---|---|
| red | 22.05 | 23.0 | 5000.0 | 350.0 | 0.0 |
| blue | 22.0 | 23.0 | 5000.0 | 350.0 | 0.0 |
中国指挥与控制学会会刊 