中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
理论研究

基于混合动态贝叶斯网的无人机空战态势评估

  • 孟光磊 1 ,
  • 马晓玉 1 ,
  • 刘昕 1 ,
  • 徐一民 2
展开
  • 1.沈阳航空航天大学, 辽宁 沈阳 110136
  • 2.西北工业大学, 陕西 西安 710129

孟光磊(1982-),男,博士,副教授,研究方向为空战智能决策、飞行仿真。

马晓玉(1993-),女,硕士研究生。

刘 昕(1980-),男,博士,讲师。

徐一民(1991-),男,本科。

收稿日期: 2017-04-10

  修回日期: 2017-05-26

  网络出版日期: 2022-05-16

Situation Assessment for Unmanned Aerial Vehicles Air Combat Based on Hybrid Dynamic Bayesian Network

  • MENG Guang-lei 1 ,
  • MA Xiao-yu 1 ,
  • LIU Xin 1 ,
  • XU Yi-min 2
Expand
  • 1. Shenyang Aerospace University, Shenyang 110136
  • 2. Northwestern Polytechnical University, Xi’an 710129, China

Received date: 2017-04-10

  Revised date: 2017-05-26

  Online published: 2022-05-16

摘要

针对无人机空战中单机对抗模式态势评估既要综合考虑连续型和离散型变量的影响,又具备不确定性的推理能力的特点,建立了一种基于混合动态贝叶斯网络的无人机空战态势评估模型。分析空战中敌我飞行数据,提取空战中战斗力要素,依据因果关系建立混合动态贝叶斯网络模型的网络拓扑结构。利用主观经验和历史数据,设计了先验概率、条件概率和状态转移概率等离散型网络参数及正态分布式连续型网络参数。采用链式算法和滤波算法进行网络推理。经仿真实验验证,证明了混合动态贝叶斯无人机空战态势评估模型具备快速性、有效性和容错性。

本文引用格式

孟光磊 , 马晓玉 , 刘昕 , 徐一民 . 基于混合动态贝叶斯网的无人机空战态势评估[J]. 指挥控制与仿真, 2017 , 39(4) : 1 -6 . DOI: 10.3969/j.issn.1673-3819.2017.04.001

Abstract

The situation assessment for the one-to-one mode of unmanned aerial vehicles air combat needs to consider the influence of continuous and discrete variables, and the uncertain reasoning as well. According to the above analysis, the situation assessment for unmanned aerial vehicles air combat based on Hybrid Dynamic Bayesian Network has been established. The flight data in an air combat has been analyzed. Some capability elements in an air combat have been extracted. According to the causal relationship, the topological structure of the Hybrid Dynamic Bayesian Network model has been established. By the subjective experience and the historical data, discrete network parameters and continuous network parameters have been designed. Discrete network parameters include prior probabilities, conditional probabilities and state transition probabilities. Continuous network parameters are some normal distributions. The chain algorithm and the filter algorithm are used for network inference. The simulation experiments showed that the situation assessment model for unmanned aerial vehicles air combat based on Hybrid Dynamic Bayesian Network has the advantages of rapidness, effectiveness and fault-tolerance.

无人机空战态势评估是指评估敌我双方的战斗力要素的当前状态和发展趋势,并根据优势程度划分态势评估优势等级[1-3]。无人机空战态势评估是无人机决策的基础,是无人机进行空战必不可少的环节[4-5]
近年来,空战态势评估及其相关研究受到学者的广泛关注。文献[6]针对空战信息不确定的特点, 提出基于不确定性信息的空战威胁评估方法,该方法计算速度快,实时性较好。文献[7]针对战场环境中信息的不确定性和交互关联性问题,提出基于认知图和直觉模糊推理的态势评估方法,该方法描述战场客观环境,有效性的为决策者提供决策信息。文献[8]针对空战态势评估的指标权重带有一定的不确定性,提出基于区间支持向量回归的空战目标威胁评估方法,该方法误差较小、精度较高,具有较好的容错性。
在战斗力要素复杂、分秒必争的战场环境下, 无人机空战态势评估需要同时具备快速性、有效性和容错性,本文提出了基于混合动态贝叶斯网的无人机空战态势评估方法。

1 基于混合贝叶斯网的空战态势评估模型

贝叶斯网络(Bayesian Network, BN)是一种基于贝叶斯公式的概率推理图形化网络,能有效地解决不定性和关联性问题[9-10]。动态贝叶斯网络(Dynamic Bayesian Network, DBN)是一个随着毗邻时间步骤把变量联系起来的贝叶斯网络,通常被叫作“两个时间片”的贝叶斯网络[11-13]。混合动态贝叶斯网(Hybrid Dynamic Bayesian Network, HDBN)是指动态贝叶斯网络中的节点变量是离散和连续混合型的。
建立基于HDBN的空战态势评估模型,首先根据态势因素间因果关系设计模型的网络结构,然后根据历史数据和经验知识确定模型的网络参数。

1.1 网络结构

分析单机对抗空战模式下的战场态势因素,确定网络输入节点变量、中间节点变量和输出节点变量,根据因果关系,将这些节点变量通过有向弧连接,建立单时间片下空战态势评估模型的网络结构;分析两个毗邻时间步骤中各网络节点变量之间的影响,确定输出节点变量为连接毗邻时间片的状态转移变量,建立基于HDBN的单机对抗空战态势评估模型结构,如图1所示。
图1 基于HDBN网络的空战态势评估模型结构图
图1可知,输入节点变量是通过载机设备获取的战场敌我位置、姿态、雷达、武器等基础态势因素,由于这类变量是可以人为观测,故定义为观测节点变量,如表1所示。
表1 观测节点变量定义
标识 描述 类型 状态集
IA 我机方位角 连续型 IA∈[-180°,+180°]
EA 敌机方位角 连续型 EA∈[-180°,+180°]
TRH 目标相对高度 连续型 TRH∈[-500m,+500m]
TD 目标距离 连续型 TD∈[0, 12km]
TCV 目标接近速度 连续型 TCV∈[+1.5Ma,-1.5Ma]
RSP 雷达相对性能 离散型 RSP={优越,均等,劣势,不确定}
TDR 目标探测结果 离散型 TDR={捕获,丢失}
WD 武器配置 离散型 WD={远距弹,近距弹,无弹}
WR 武器射程 离散型 WR={均势,优于敌机,弱于敌机}

注:连续型节点的数据,若超过取值范围,取边界值。

表1连续型变量IA、EA、TRH、TD和TCV离散化处理成离散型变量DIA、DEA、DTRH、DTD和DTCV。其中,DIA、DEA和DTRH状态集划分如图2~图4。其中,红方代表我方,蓝方代表敌方。DTD和DTCV状态集划分如式(1)和式(2)。
DTD= C   ( T D < 6 k m ) L   ( T D > 6 k m )
DTCV= C T   ( T C V > 0 M a ) A F   ( T C V < 0 M a )
图1可知,中间节点变量是将9种基础态势整合成综合态势的过程变量,如表2所示。
表2 中间节点变量定义
标识 描述 类型 状态集
EIA 敌我方位角 离散型 EIA=DIA×DEA=(dia,dea)5×5
DIA={IF,IL,IR,ILE,IRE}
DEA={EF,EL,ER,ELE,ERE}
TB 目标
方位
离散型 TB=MEIA×DTRH=(meia,dtrh)9×3
MEIA=MDIA×MDEA
MDIA={IF,IM,IE}
IM={IL,IR},IE={ILE,IRE}
MDEA={EF,EM,EE}
EM={EL,ER},EE={ELE,ERE}
DTRH={A,O,B}
TSD 目标
占位
离散型 TSD=TB×DTD=(tb,dtd)27×2
tbTB DTD={C,T}
TSS 空间
态势
离散型 TSS=TSD×DTCV=(tsd,dtcv)54×2
tsdTSD DTCV={CT,AF}
EDP 敌机探测性能 离散型 EDP=TD×RSP×MDEA
=(dtd,rsp,dea)2×4×5
DTD={C,L},rspRSP,
DEA={EF,EL,ER,ELE,ERE}
TIN 信息
态势
离散型 TIN=EDP×TDR=(edp,tdr)3×2
edpEDP,tdrTDR
WS 武器
状态
离散型 WS=WD×WR=(wd,wr)3×3
wdWD,wrWR
ATK 攻击
态势
离散型 ATK=TIN×WS=(tin,ws)4×3
tinTIN,wsWS
ATK={AT,UAT,UAC}
SDF 综合
态势
离散型 EIS=TSS×MATK=(tss,matk)108×2
tssTSS MATK={AT,U}
U={UAT,UAC}
图1可知,由于输出节点变量是网络结构的根源,称为根节点变量,该节点变量将216种综合态势划分为9个优势等级,从1到9,我方优势逐渐减小,如表3所示。
表3 根节点变量定义
标识 描述 类型 状态集
SA 态势评估 离散型 {1,2,3,4,5,6,7,8,9}

1.2 网络参数

基于HDBN的空战态势评估模型网络参数分为3类:先验概率、条件概率和状态转移概率。

1.2.1 先验概率

模型中的先验概率指是观测节点和根节点中各状态根据以往经验和分析定义的概率。如式(3),模型中有10个先验概率。
P(A)= 1 n
式(3)中,n为节点A的状态维数。

1.2.2 条件概率

模型中的条件概率是指在子节点发生的条件下父节点发生的概率。由于模型节点有2种类型,故条件概率也是两种形式。父子节点都是离散型节点的条件概率通过父子节点间具体关系组成条件概率表。这种条件概率表有13个。父子节点有一方是连续型节点的条件概率由正态分布函数表达。如式(4),这种正态分布函数有24个。
φi=P(A/B)= 1 2 π σ e - ( B - μ ) 2 2 σ 2
式(4)中,A为父节点中某一状态,B为子节点变量,μσ是正态分布函数的均值和方差。
例如:EIA-IA条件概率为正态分布函数式如式(5)~式(9),分布曲线如图5~图9
φ1=P(EIA=IFEA/IA)= 1 2 π × 45 e - I A 2 2 × 45 2
φ2=P(EIA=ILEA/IA)= 1 2 π × 45 e - ( I A + 90 ) 2 2 × 45 2
φ3=P(EIA=IREA/IA)= 1 2 π × 45 e - ( I A - 90 ) 2 2 × 45 2
φ4=P(EIA=ILEEA/IA)= 1 2 π × 45 e - ( I A + 180 ) 2 2 × 45 2
φ5=P(EIA=IREEA/IA)= 1 2 π × 45 e - ( I A - 180 ) 2 2 × 45 2
图5 IF正态分布曲线图
图6 IL正态分布曲线图
图7 IR正态分布曲线图
图8 ILE正态分布曲线图
图9 IRE正态分布曲线图

1.2.3 状态转移概率

模型中状态转移概率是指存在于连接毗邻时间片的根节点由一种状态转移到另一种状态的概率。由于根节点是离散型节点,状态转移概率组成状态转移概率表。状态转移概率定义如式(10)。
P(At=i/At-1=j)= a     i = j 1 - a n - 1 i j
式(10)中,a为根据实际情况定义的概率值,i, jA的状态,nA的状态维数。

2 空战态势评估模型推理

2.1 理论依据

链式算法应用于单连通贝叶斯网络推理,是贝叶斯定理的扩展,推理公式:
P(X/K)= Y P(X/Y) Z P(Y/Z)P(Z/K)
式(11)中,拓扑结构为XYZK
滤波算法应用于动态贝叶斯网推理,是利用过去结果和当前证据预测当前结果的推理方法,推理公式:
P(Xt/E1:t)=αP(Xt/Et)P(Et)P(Xt/ X t - 1 m a x)P(Xt-1/E1:t-1)/P(Xt)
式(12)中,E代表证据,X代表连接毗邻时间片的节点,t-1代表过去,t代表当前。P(Xt-1/E1:t-1)和P(Xt/E1:t)是过去和当前网络滤波推理后的概率结果,P(Xt/Et)是当前网络滤波推理前的概率结果,P(Et)和P(Xt)是当前证据E和节点X的先验概率, X t - 1 m a x是过去网络滤波推理后最大的概率结果对应的状态,P(Xt/ X t - 1 m a x)是当前和过去间节点X的状态转移概率,α是归一化因子。

2.2 推理过程

本模型推理流程如图10。具体步骤如下:
图10 网络推理流程图
步骤1:初始化HDBN网络参数:观测节点先验概率v1~9、根节点先验概率v10、条件概率表B1-13、正态分布函数φ1~24和状态转移概率表C。设定网络推理周期n
步骤2:初始时刻,将模型网络拆成11条单连通网络,根据链式算法,计算11个单连通网络的条件概率。
步骤3:通过连乘法,将11个条件概率合并为模型网络的条件概率P(SA1/E1),将9个观测节点先验概率合并为证据先验概率P(E1)。
步骤4:比较模型网络条件概率的大小,确定最大的条件概率对应的根节点状态,从表C中获取状态转移概率P(SA1/S A 1 m a x)。
步骤5:根据滤波算法,计算模型网络滤波后的条件概率如式(13)。
P(SA1/E1:1)=αP(SA1/E1)P(E1)P(SA1/S A 1 m a x)P(SA1/E1)/P(SA1)
步骤6:第二时刻,重复步骤2和步骤3,比较上一时刻滤波后模型网络条件概率的大小,确定最大的条件概率对应的根节点状态,从表C中获取状态转移概率P(SA2/S A 1 m a x)。
步骤7:根据滤波算法,计算模型网络滤波后的条件概率如式(14)。
P(SA2/E1:2)=αP(SA2/E2)P(E2)P(SA2/S A 1 m a x)P(SA1/E1:1)/P(SA2)
步骤8:重复步骤6和步骤7,直至完成n次推理,输出最大的条件概率P(SAn/E1:n)max及其对应的根节点状态。

3 仿真与分析

为了验证动态混合贝叶斯网络态势评估模型,选用从我方发现到击落敌方的空战场景,开展仿真实验,轨迹如图11,其中红方为我方,蓝方为敌方。
图11 单机对抗空战轨迹图
选取飞行过程中3个典型的时间段,时间段1来源于空战初始阶段,时间段2来源于空战中间阶段,时间段3来源于空战末尾阶段。观测数据如表4表5所示。
表4 连续型观测数据
时间段 EAZ IAZ TRH TD TCV
89.96 -89.88 2999.98 10.7525 0.0017
89.97 -89.73 2999.97 10.7525 0.0051
1 89.97 -89.43 2999.95 10.7525 0.0121
89.97 -88.98 2999.89 10.7524 0.0234
89.98 -88.53 2999.78 10.7523 0.0282
69.41 2.38 998.73 6.4647 0.9990
69.74 2.40 995.20 6.4613 0.9875
2 70.08 2.43 991.67 6.4579 0.9760
70.41 2.45 988.16 6.4546 0.9648
70.75 2.47 984.65 6.4513 0.9536
170.11 3.74 -492.50 5.5527 0.0115
170.29 3.73 -492.52 5.5527 0.0115
3 170.46 3.72 -492.54 5.5526 0.0115
170.63 3.71 -492.57 5.5525 0.0114
170.80 3.69 -492.59 5.5525 0.0114
表5 离散型观测数据
时间段 RSP TDR WD WR
1-3 0 0 0 1
图12~图14,描绘了3个时间段的动态混合贝叶斯网络态势评估模型的输出概率分布。图中x轴代表态势评估节点的9种优势等级,从1到9,我方优势逐渐减小;y轴代表迭代次数;z轴代表模型输出概率。模型中时间段1、时间段2和时间段3的输出概率经过5次迭代收敛于4等级、2等级和1等级,其收敛速度快,证明了模型具备快速性的特点。同时,决策者可以通过评估出的优势等级,进行相应机动决策,证明了模型具备有效性的特点。
图12 时间段1概率分布图
图13 时间段2概率分布图
图14 时间段3概率分布图
将时间段2中混入了1帧错误数据,时间段3中混入2帧连续的错误数据,如表6
表6 错误数据
时间段 EAZ IAZ TRH TD TCV
2 78.15 10.25 901.23 6.4513 0.9536
3 150.12 -3.14 -350.06 5.5525 0.0114
151.10 -3.33 -350.42 5.5525 0.0114
经过动态混合贝叶斯网络态势评估模型,输出概率分布如图15图16。时间段2和时间段3经5次迭代后仍收敛于2等级和1等级,证明了模型具备较好的容错性。
图15 混入1帧错误数据时间段2概率分布图
图16 混入2帧错误数据时间段2概率分布图

4 结束语

本文通过混合动态贝叶斯网对无人机空战进行态势评估,该方法既考虑了空战战场存在连续型和离散型的战斗力因素,又具备运行速度快、容错能力良好等特点,能较好地解决当前无人机空战决策系统中的态势评估问题。然而,随着空中作战日益发展,未来无人机空战决策系统必将对空战态势评估的速度和精度提出更高的要求,参数学习将成为混合动态贝叶斯网学习的一个重点和难点。本文希望抛砖引玉,为混合动态贝叶斯网的无人机空战态势评估问题的后续发展提供技术参考和研究方向。
[1]
马向玲, 雷宇曜. 有人/无人机协同作战关键技术[J]. 火力与指挥控制, 2012, 37(1):78-81.

[2]
吴文海, 周思羽, 高丽, 等. 基于导弹攻击区的超视距空战态势评估改进[J]. 系统工程与电子技术, 2011, 33(12):2679-2685.

[3]
Gavan L. Introuduction to the soecial issue on cognitive systems[J]. The International Journal of Aviation Psychology, 2011, 32(1):1-2.

[4]
Rui X T, Wang G P, Lu Y Q, etc. Advances in Rocket Launch Dynamics[C]. J Carleone, D Orphal. 20th International Symposium on Ballistics. Florida: DEStech Publication, 2002: 408-415.

[5]
傅莉, 于梅祥. 混合对策无人战机空战决策[J]. 火力与指挥控制, 2011, 36(8):67-70.

[6]
王昱, 章卫国, 傅莉, 等. 基于不确定性信息的空战威胁评估方法[J]. 西北工业大学学报, 2016, 34(2):299-305.

[7]
李闯, 端木京顺, 雷英杰, 等. 基于认知图和直觉模糊推理的态势评估方法[J]. 系统工程与电子技术, 2012, 34(10):2064-2068.

[8]
郭辉, 吕英军, 王平, 等. 基于区间支持向量回归的空战目标威胁评估[J]. 火力与指挥控制, 2014, 39(8):17-21.

[9]
李伟生, 王宝树. 基于贝叶斯网络的态势评估[J]. 系统工程与电子技术, 2003, 25(4):480-483.

[10]
王三民, 王宝树. 贝叶斯网络在战术态势评估中的应用[J]. 系统工程与电子技术, 2004, 26(11):1620-1623,1679.

[11]
晏师励, 李德华. 基于动态贝叶斯网络的空战目标威胁等级评估[J]. 计算机与数字工程, 2015, 43(12):2150-2154,2198.

[12]
史建国, 高晓光, 李相民. 基于离散模糊动态贝叶斯网络的空战态势评估及仿真[J]. 系统仿真学报, 2006, 18(5):1093-1100.

[13]
任佳, 崔亚妮, 张婧. 基于时变DBN的UAV航路威胁评估模[J]. 计算机仿真, 2014, 31(6): 60-64,107.

文章导航

/