中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
无人平台自主指挥控制

基于改进优势函数的UCAV多机编队空战机动决策方法*

  • 徐光达 ,
  • 周晓光 ,
  • 杨晓阳 ,
  • 郭彦 ,
  • 李映红
展开
  • 中国人民解放军91475部队, 辽宁 葫芦岛 125001

徐光达(1990—),男,硕士,研究方向为作战运筹分析和模拟飞行训练。

周晓光(1982—),男,高级工程师。

收稿日期: 2024-12-24

  修回日期: 2025-01-21

  网络出版日期: 2026-01-23

基金资助

*国家社会科学基金(2023-SKJJ-B-035)

Research on the maneuver decision method for multi-aircraft formation air combat of UCAVs based on the improved dominance function

  • XU Guangda ,
  • ZHOU Xiaoguang ,
  • YANG Xiaoyang ,
  • GUO Yan ,
  • LI Yinghong
Expand
  • Unit 91475 of PLA, Huludao 125001, China

Received date: 2024-12-24

  Revised date: 2025-01-21

  Online published: 2026-01-23

摘要

多机协同空战将是UCAV未来的主要作战模式之一。针对UCAV多机协同空战中的双机编队空战机动决策问题,在有效融合空空导弹攻击区和不可逃逸区等先验知识的基础上,提出了一种改进优势函数的UCAV双机编队空战机动决策方法。首先,根据空空导弹的攻击区和不可逃逸区来改进空战态势优势函数;其次,以飞机基本操作方式为基础,结合典型空战战术动作建立了UCAV空战机动动作库;最后,构建仿真案例,对机动轨迹、优势函数、目标攻击选择进行了仿真分析,仿真实验结果表明,基于改进优势函数的编队空战机动决策模型能够使我方UCAV双机编队做出针对敌方策略的正确决策。该方法对于进一步开展多机空战决策领域的相关研究具有借鉴意义。

本文引用格式

徐光达 , 周晓光 , 杨晓阳 , 郭彦 , 李映红 . 基于改进优势函数的UCAV多机编队空战机动决策方法*[J]. 指挥控制与仿真, 2026 , 48(1) : 20 -27 . DOI: 10.3969/j.issn.1673-3819.2026.01.003

Abstract

Multi-UCAV coordinated air combat will be one of the main combat modes of UCAV in the future. For the problem of dual-UAV formation air combat maneuver decision-making in UCAV coordinated air combat, an improved evaluation function UCAV dual-UAV formation air combat maneuver decision-making method was proposed based on the effective integration of prior knowledge such as air-to-air missile attack area and unescapable area. Firstly, the air combat situation evaluation function was improved based on the attack area and unescapable area of air-to-air missiles. Secondly, the basic operation modes of aircraft were combined with typical air combat tactical actions to establish a UCAV air combat maneuver action library. Finally, a simulation case was constructed, and the simulation analysis was conducted on the maneuver trajectory, advantage function,and target attack selection. The simulation experimental results show that the formation air combat maneuver decision model based on the improved evaluation function can enable the UCAV dual-UAV formation to make the correct decision against the enemy’s strategy. This method provides a reference for further research in the field of multi-UCAV air combat decision-making.

随着航空装备向无人化、综合化、智能化的方向发展,无人作战飞机(unmanned combat aerial vehicle,UCAV)已成为现代空战中不可或缺的主战力量。UCAV自主空战机动决策是指在作战过程中,UCAV根据敌我双方的态势信息,结合战机自身的空战性能,实时地选择机动动作,达成先敌占位、先敌攻击的过程[1]。目前针对一对一背景下的空战机动决策问题,国内外学者正广泛开展研究,且成果颇丰。而实际作战中,多数场景均是多架战机组成编队遂行协同空战,并且现有文献中鲜有关于UCAV编队空战的研究。所以,研究UCAV多机编队空战机动决策问题,对于提升UCAV自主作战决策水平和有人/无人协同作战能力具有重要的军事意义。
截至目前,国内外解决自主空战机动决策问题的方法大体上可分为基于博弈对策和最优控制理论的方法和基于专家规则和机器学习的启发式智能方法这两大类。第一类方法通常存在决策过程复杂、UCAV机动响应慢等问题,难以适应空战环境的动态性与实时性。第二类方法适应性强、在线学习能力好,但其算法结构和参数设置带有较强的主观性,比较依赖专家知识设计态势优势函数,且算法搜索效率有限、实时性差。近年来,许多学者采用人工智能算法建立机动决策模型,成果显著。如王芳杰等[2]提出了以博弈理论为基础的无人机近距一对一空战自主机动决策方法,但该方法只能得出在相对较短时段内的最优机动策略,对于较长的时段来讲,不一定是最佳方案,且计算实时性较差;谢建峰等[3]给出了一种基于强化遗传算法的空战机动决策模型,能够优化计算效率,然而缺少对空战机动动作的设计与定量描述;奚之飞等[4]采用改进粒子群算法,研究了面向多目标的空战决策问题,有效提高了模型的搜索效率,但评估结果容易陷入局部最优。目前国内外针对自主空战机动决策方法的相关研究中,对空空导弹攻击区考虑较少,优势函数建立难以有效描述空战决策过程,导致空战决策依据不足,未能将影响空战决策的核心因素考虑到机动决策问题中,仿真逼真度不够。
针对上述问题,本文提出了一种基于改进优势函数的UCAV二对二自主空战机动决策模型。一是在建立UCAV机动动作库的基础上,本文充分考虑敌方战机对我方战机的威胁,分析不同态势条件下导弹攻击区域的变化情况;二是以UCAV挂载的空空导弹攻击区为依据,本文选取角度、距离、速度和高度等作为主要影响因素构建态势优势函数,用我方战机对敌方战机优势函数值的大小来衡量每一步备选机动动作的优劣,即每一步机动均选取优势函数值较大的机动动作作为最佳决策,从而产生最优的对抗策略。最终,本文通过编队空战仿真实验验证了该模型的科学性和有效性。

1 空空导弹攻击区模型

空空导弹攻击区是指在一定作战条件下,导弹发射后能够以毁伤目标存在于战机周围允许发射空空导弹的空间范围[5],它主要是由空空导弹的性能决定的。当前对于导弹攻击区的解算方法早已十分成熟,但其在空战态势评估和机动决策中未能被充分考虑。
参考有关空空导弹攻击区实时解算的相关文献[6-7]可知,文中所涉及的空空导弹在我方战机速度vm为0.8Ma,敌方战机速度vt为0.8Ma,飞行高度为h=3 000 m且未实施机动时的攻击区如图1所示,而在其他条件不变,空空导弹在敌方战机进行侧向机动规避时的攻击区见图2
图1 敌机不实施机动的攻击区

Fig.1 Attack area where enemy aircraft do not maneuver

图2 敌机向我机实施机动的攻击区

Fig.2 Attack area where enemy maneuver at our UCAVs

2 基于改进优势函数的UCAV多机编队空战机动决策模型

2.1 UCAV编队空战任务协同机制及优势获取方法

UCAV编队多机协同空战是指两架或两架以上UCAV互相配合、相互协作,完成空战任务的一种作战模式。如在双机编队中,一架战机作为长机负责主攻,另一架战机作为僚机负责掩护和支援,这种编队形式在实际空战中可以灵活调整角色,从而提升编队的整体作战效率。
UCAV编队的空战任务协同不仅包括时间协同,还包括战机相对姿态、相对位置等要素的协同。具体来讲,模型在发现敌方战机后,控制中心根据敌方编队信息和编队任务结构,将空战任务分解为攻击和掩护2个子任务,发送给编队。长机根据接收到的攻击任务信息,结合本机特性进行任务分析,得出攻击任务所需时间T1,而后轨迹规划模块根据输入量T1、来自战机飞控系统的速度、姿态等参数及自感知系统的长、僚机间的相对位置、相对角度、相对距离、相对速度、相对高度等信息,快速规划出最优攻击及机动轨迹,最后通过通信系统将长机攻击时间T1、轨迹数据、武器参数等信息发送给控制中心和僚机。
僚机在接收到控制中心和长机发送的信息后,根据掩护任务所需时间T2,综合飞控系统、感知系统的数据作为轨迹规划模块的输入,规划出最优的掩护轨迹,而后将结果及相关数据信息发送给控制中心和长机。控制中心利用来自编队的反馈信息来检测编队的空间运动及任务协同情况。
UCAV在编队空战过程中要根据当前的战场态势实时调整机动动作和策略。而空战态势是综合战场动态信息和UCAV本身固有空战能力,分析对抗双方态势优劣的过程。UCAV固有能力为静态性能指标,一般是恒定不变的,而对UCAV编队空战态势和机动决策方案影响较大的便是相对角度等态势动态指标。本文基于现代空战特性以及敌我双方的几何态势,选取角度、距离、速度和高度这4项态势动态指标,表征攻击条件和实时对抗性能的变化对双方态势的影响,并建立相应的优势函数模型。

2.2 多机自主空战决策模型框架

多机自主空战机动决策流程框架如图3所示,红方战机(UCAV)编队主要利用基于改进优势函数的编队空战自主机动决策模块,以红蓝双方战机编队的基本态势信息为输入,将机动动作控制指令作为输出,该模型中红方编队除了考虑双方态势信息之外,还需实时计算双方的优势函数值,通过比较红蓝方相互优势函数值的大小,来预测蓝方下一时刻的机动指令选择;对于蓝方战机编队,在对抗中需依据双方态势信息并利用基于传统优势函数的编队空战自主机动决策模块,从基于专家规则的机动动作库中选用适当的机动动作,最终输出飞行控制指令驱动蓝方战机进行空战。
图3 多机编队自主空战机动决策流程框架

Fig.3 Multi-aircraft formation autonomous air combat maneuver dicision process

2.3 UCAV空战动力学模型

UCAV的空战机动可看作为质点运动,选取惯性坐标系建立UCAV三自由度运动模型,并用质点模型描述UCAV的运动学方程为
x ˙ = v c o s   γ s i n   ψ y ˙ = v c o s   γ c o s   ψ z ˙ = v s i n   γ
UCAV的动力学方程在同一坐标系中可表示为
v ˙ = g n x - s i n   φ φ ˙ = g V n y c o s   γ - c o s   φ ψ ˙ = g n y s i n   γ V c o s   φ
式中:xyz分别为UCAV的质心在惯性系中的坐标;V为UCAV的速度大小;φ,ψ分别为惯性系坐标系中UCAV的俯仰角与偏航角;g为重力加速度;nx,ny,γ分别为切向过载、法向过载以及由升降舵和副翼耦合控制的滚转角。切向过载与无人机的阻力和油门控制的发动机的推力有关,其方向为机身对称面内垂直于机头方向[8]。因此,该模型的状态向量为S= x , y , z , V , φ , ψ,控制向量为U= n x , n y , γ。通过UCAV的控制向量便可计算出UCAV下一时刻的状态向量,则递推公式为
$ \boldsymbol{S}_{t+1}=\boldsymbol{S}_{t}+\int_{t}^{t+1}\left(\boldsymbol{S}_{t}, u_{t}\right) \mathrm{d} t$

2.4 双机编队空战几何态势模型

考虑仿真应用和解算实时性需求,本文对双机编队空战中双方空战态势进行几何学建模,如图4所示。在惯性坐标系中,红色战机R1R2为我方战机,蓝色战机B1B2为敌方战机,红方1号和蓝方1号的位置坐标分别为( x 1 r, y 1 r, z 1 r)、( x j b, y j b, z j b);速度向量分别为VrVb;相对距离向量为R;速度向量与距离向量组成的夹角,即战机方位角为α1α2。UCAV所配用的空空导弹不可逃逸区的最大、最小距离(上界、下界)分别为RmaxRmin
图4 双机编队几何关系示意图

Fig.4 Schematic chart of the geometric relationship of two-aircraft formation

2.5 UCAV机动决策优势函数

2.5.1 角度优势函数

考虑我方UCAV和敌方战机的方位角和速度,本文依据双方战机编队空战几何位置关系,采用文献[9]方法将双方战机的空战态势大体分为相对优势、相对劣势和互为均势的3种态势,用α1α2分别表示我方UCAV和敌方战机的方位角,即UCAV与敌方战机的速度向量分别与距离向量R的夹角,则三种态势的判断依据如下:
当0≤ α 1 π 2且0≤ α 2≤π时,双方态势关系为我方UCAV相对优势;
π 2 α 1≤π且 π 2 α 2≤π时,双方态势关系为我方UCAV相对劣势;
π 2< α 1≤π且0< α 2 π 2时,双方态势关系为互为均势;
本文设角度优势函数为μA,距离向量R=[xr-xb,yr-yb,zr-zb],则表达式为
$ \alpha_{1}=\arccos \left(\frac{\boldsymbol{V}_{b} \cdot \boldsymbol{R}}{\left|\boldsymbol{V}_{b}\right| \cdot|\boldsymbol{R}|}\right), \alpha_{2}=\arccos \left(\frac{\boldsymbol{V}_{r} \cdot \boldsymbol{R}}{\left|\boldsymbol{V}_{r}\right| \cdot|\boldsymbol{R}|}\right)$
$ \boldsymbol{V}_{r}=\left|\boldsymbol{V}_{r}\right| \cdot\left[\begin{array}{c}\cos \varphi_{r} \cos \psi_{r} \\\cos \varphi_{r} \sin \psi_{r} \\\sin \varphi_{r}\end{array}\right]$
$ \boldsymbol{V}_{b}=\left|\boldsymbol{V}_{b}\right| \cdot\left[\begin{array}{c}\cos \varphi_{b} \cos \psi_{b} \\\cos \varphi_{b} \sin \psi_{b} \\\sin \varphi_{b}\end{array}\right]$
$ \mu_{A}=\left\{\begin{array}{ll}e^{\left(\frac{3 \pi}{2}-\left|\alpha_{1}\right|-\left|\alpha_{2}\right|\right)} & 0 \leqslant\left|\alpha_{1}\right| \leqslant \frac{\pi}{2} \cap 0 \leqslant\left|\alpha_{2}\right| \leqslant \pi \\e^{\left(1-\frac{\left|\alpha_{1}\right|+\left|\alpha_{2}\right|}{\pi}\right)} & \frac{\pi}{2}<\left|\alpha_{1}\right| \leqslant \pi \cap \frac{\pi}{2}<\left|\alpha_{2}\right| \leqslant \pi \\e^{2\left(1-\frac{\left|\alpha_{1}+\left|\alpha_{2}\right|\right.}{\pi}\right)} & \frac{\pi}{2}<\left|\alpha_{1}\right| \leqslant \pi \cap 0<\left|\alpha_{2}\right| \leqslant \frac{\pi}{2}\end{array}\right.$
式中:下标为r的代表我方UCAV参数,下标为b的代表敌方战机参数。VrVb分别为我方UCAV和敌方战机的速度矢量。

2.5.2 距离优势函数

本文构建距离优势函数需要综合考虑双方战机的距离、机载雷达探测范围以及空空导弹攻击范围等因素。为提升空战效能,本文需将空空导弹攻击的不可逃逸区概念应用到构建距离优势函数中。若敌方战机处于我方UCAV的不可逃逸区之内,则距离优势函数将达到最大值1。本文设距离优势函数为μR,双方战机距离为R,则表达式为
$ \mu_{R}=\left\{\begin{array}{ll}0 & R \geqslant R_{R \max } \\0.5 e^{-\frac{R-R_{M \max }}{R_{R \max }-R_{M \max }}} & R_{M \max } \leqslant R \leqslant R_{R \max } \\2^{-\frac{R-R_{\max }}{R_{M \max }-R_{\max }}} & R_{\max } \leqslant R \leqslant R_{M \max } \\1 & R_{\min } \leqslant R \leqslant R_{\max }\end{array}\right.$
式中:RRmax为机载雷达对目标机的最远探测距离,RMmax为空空导弹攻击区的边界,UCAV所配用的空空导弹不可逃逸区为[Rmin,Rmax],Rmin为不可逃逸区距离下界,Rmax为上界,因此在实际作战中,算法应使敌方战机尽快进入到我方UCAV的不可逃逸区,UCAV才会大概率命中目标。

2.5.3 速度优势函数

空战中,速度会对交战双方战机的机动性造成影响,接敌速度过快会导致攻击锁定的时间缩短,而不能简单地认为空战态势占优。本文在构建速度优势函数时需要引入最佳攻击速度的概念[9]。当敌方战机处于我方UCAV的攻击不可逃逸区之内时,最佳攻击速度 V *取敌机速度 V b,当敌方战机处于攻击不可逃逸区之外时,应进行加速或者减速来使敌方战机尽早进入不可逃逸区,因此 V *表示为
$ \left|\boldsymbol{V}^{*}\right|=\left\{\begin{array}{ll}\left|\boldsymbol{V}_{r}\right|-\left(\left|\boldsymbol{V}_{r}\right|-\boldsymbol{V}_{\min }\right)\left(1-e^{\frac{|\boldsymbol{R}|-\boldsymbol{R}_{\min }}{R_{\min }}}\right) & |\boldsymbol{R}|<\boldsymbol{R}_{\min } \\\left|\boldsymbol{V}_{b}\right| & \boldsymbol{R}_{\min } \leqslant|\boldsymbol{R}| \leqslant \boldsymbol{R}_{\max } \\\left|\boldsymbol{V}_{r}\right|+\left(\boldsymbol{V}_{\max }-\left|\boldsymbol{V}_{r}\right|\right)\left(1-e^{\frac{\boldsymbol{R}_{\max }-|\boldsymbol{R}|}{\boldsymbol{R}_{\max }}}\right) & |\boldsymbol{R}|>\boldsymbol{R}_{\max }\end{array}\right.$
则定义速度优势函数μV
$ \mu_{V}=\left\{\begin{array}{ll}e^{-\frac{\left|\boldsymbol{V}_{r}+\left|\boldsymbol{V}^{*}\right|\right.}{\left|\boldsymbol{V}^{*}\right|}} & \left|\boldsymbol{V}^{*}\right| \leqslant\left|\boldsymbol{V}_{r}\right| \\\frac{2}{5}\left(\frac{\left|\boldsymbol{V}_{r}\right|}{\left|\boldsymbol{V}^{*}\right|}+\frac{\left|\boldsymbol{V}_{r}\right|}{\left|\boldsymbol{V}_{b}\right|}\right) & 0.6\left|\boldsymbol{V}_{b}\right|<\left|\boldsymbol{V}_{r}\right|<\left|\boldsymbol{V}^{*}\right| \\0.1 & \left|\boldsymbol{V}_{r}\right| \leqslant 0.6\left|\boldsymbol{V}_{b}\right|\end{array}\right.$

2.5.4 高度优势函数

空战对抗中,作战方具有较高的相对高度通常占据势能优势[10],同时战机的飞行高度也会对战机自身性能的发挥以及空空导弹的发射造成一定影响。在构建高度优势函数时,本文需引入最佳空战高度的概念,设UCAV在攻击时存在最佳空战高度为hd,则高度优势函数μH可表示为
$ \mu_{H}=\left\{\begin{array}{ll}\left(\frac{h_{r}}{h_{b}} e^{-\frac{\left|2 h_{r}-h_{b}\right| h_{d}}{2 h_{d}}}\right)^{\frac{1}{2}}, & h_{r} \in\left[h_{\min }, h_{\max }\right] \\0, & h_{r} \notin\left[h_{\min }, h_{\max }\right]\end{array}\right.$
式中:hr为我方UCAV的飞行高度,hb为敌方战机的飞行高度;我方UCAV的升限范围为[hmin,hmax],hminhmax分别为UCAV的升限下界和上界,UCAV的飞行高度hr越接近最佳空战高度hd,其高度优势越大。

2.5.5 机动决策优势函数

本文将角度、距离、速度和高度这4种评价函数综合考虑,按照权重规则把这4个函数相加,然后根据该评价函数,战机便能够选用最优的控制变量进而输出最佳的机动动作,最后形成一个实用的机动方案。笔者采用加权法构造攻击机对目标机的机动决策优势函数,因此,机动决策评价函数为
$ \mu=\omega_{A} \mu_{A}+\omega_{R} \mu_{R}+\omega_{V} \mu_{V}+\omega_{H} \mu_{H}$
式中:ωAωRωVωH分别表示角度、距离、速度和高度4种评价函数的权重,其具体值可由专家打分给出,且ωA+ωR+ωV+ωH=1。
传统的空战机动决策研究中,较多是比较敌方战机优势函数值μb和我方战机优势函数值μr的大小,并通过两者的差值μr-μb来反映我方战机空战优势的大小。
但在不同态势下,若μrμb的值接近或相同时,该差值难以反映出我机与敌机在不同情况下的态势优劣。因此,笔者采用我机与敌机的机动决策优势函数值作比值的方法来构造我机对于敌机的总机动决策优势,函数可表示为
$ \mu_{z}=\frac{\mu_{r}}{\mu_{b}}$

2.5.6 UCAV编队空战目标攻击选择策略

策略1: 基于优势函数值的目标攻击选择策略
本文设红方编队两架战机为R1和R2,蓝方编队两架战机为B1和B2。以R1为例,R1作为攻击主体,该策略主要比较R1对B1和R1对B2的优势函数值,选取对敌优势函数值最大的蓝方战机作为打击目标。当R1对B1以及R2对B1打击的优势函数值较大时,此时红方战机编队主要采取局部二对一的攻击策略。若R2对B2的优势函数值较大时,红方战机编队主要采取局部一对一的策略。
策略2:基于编队协同的目标攻击选择策略
该策略主要根据目标对攻击主体的威胁程度来确定打击目标。编队中的两架战机一架为主攻击机,负责对蓝方编队中威胁程度较高的战机进行打击,而另一架战机为辅攻击机,负责对蓝方编队中威胁程度较低的战机进行牵制或打击,以提升双机协同攻击时的协同性和准确性。以策略1中的战机编号为例,若R1负责攻击B1,则R2负责攻击B2。反之,若R1负责攻击B2,则R2负责攻击B1

3 UCAV机动动作库构建

机动动作库是集中了UCAV在实战中可用的机动动作,把这些动作组合运用,从而产生了UCAV动态的机动决策过程[11],它是UCAV实现自主机动决策的前提和依据。到目前为止,有两种类型的机动动作库使用较为广泛:一类是基于实战中的战术动作而制定的“典型战术动作库”,另一类是基于飞机操纵方式的“基本机动动作库”。
本文以美国国家航空航天局(NASA)学者提出的“基本机动动作库”作为UCAV自主空战的机动动作库。此机动动作库包含7种机动动作:稳定平飞、最大加速、最大减速、最大过载爬升、最大过载俯冲、最大过载左转和最大过载右转[12]。这些动作相互结合基本能够生成UCAV空战时的所有机动动作。
以上7种机动动作控制量参数见表1。将表1中的相应参数分别代入UCAV的空战动力学模型中,进一步积分运算后,即可得到下一时刻敌方战机的机动动作状态。
表1 UCAV机动动作库控制量参数

Tab.1 UCAV maneuvering library control parameters

机动动作 nx ny γ
匀速平飞 0 1 0
最大过载加速 nxmax 1 0
最大过载减速 -nxmax -nxmax1 0
最大过载爬升 nx ny 0
最大过载俯冲 0 -ny 0
最大过载左转 0 ny -arccos(1/ny)
最大过载右转 0 ny arccos(1/ny)

4 仿真分析

4.1 仿真任务想定

某次空战中,蓝军派出双机编队(记作B1B2),该编队由两架有人战斗机组成,企图进犯红军领空。红军在识别蓝军意图后,迅速派出隐身性能与空战能力俱佳的两架UCAV组成的双机编队(记作R1R2),对敌实施空中截击,紧接着红军与蓝军之间的二对二编队空战一触即发。红军和蓝军战机分别挂载近距红外格斗空空导弹。对抗过程中,红军战机编队采用基于改进优势函数的空战机动决策模型进行仿真;蓝军战机编队则采用相对固定的战术策略(如破S机动、迎头/尾追转弯等)进行机动[13],双方在指定对抗空域内开展自由空战。该任务想定的实验初始参数设置见表2。为降低任务复杂程度,确保仿真实验的准确度,本文仿真中的UCAV编队空战目标选择策略选用策略1,即基于优势函数值的目标攻击选择策略。
表2 仿真实验初始设置

Tab.2 Initial setup of simulation experiment

参数
重力加速度g 9.81 m/s2
最大切向过载nxmax 8 g
最大法向过载nfmax 3 g
距离优势函数参数σ2R 100 m
距离优势函数参数σ2h 1 000 m
机载雷达最远探测距离RRmax 3 000 m
空空导弹攻击区的边界RMmax 2 000 m
导弹不可逃逸区最大距离Rmax 1 000 m
导弹不可逃逸区最小距离Rmin 500 m
最大攻击速度Vmax 800 m/s
最小攻击速度Vmin 300 m/s
最佳空战高度hr 7 500 m
UCAV升限下界hmin 2 000 m
UCAV升限上界hmax 10 000 m
角度优势函数权重ωA 0.25
距离优势函数权重ωR 0.25
角度优势函数权重ωV 0.25
角度优势函数权重ωH 0.25
四架战机初始速度 500 m/s
四架战机俯仰角 0
四架战机偏航角 -π/2
红方战机R1初始位置 (0,1 000,5 000)
红方战机R2初始位置 (0,0,5 000)
蓝方战机B1初始位置 (5 000,1 000,6 000)
蓝方战机B2初始位置 (4 000,0,6 000)
仿真步长 0.25 s
决策步长 2.5 s
仿真总时长 120 s

4.2 仿真结果分析

图5为红方UCAV双机编队与蓝方有人战斗机双机编队的空战对抗机动轨迹。由仿真实验初始设置参数可以看出,红方UCAV双机编队的相对高度较蓝方高,初始位置占优。在此情况下,红方编队和蓝方编队都企图对进入对手的“后半球”进行尾后攻击,率先发射导弹。由图5可知,仿真开始后,蓝方双机编队主动采取进攻策略,向下俯冲接近红方双机编队并对其保持高度优势,并使红方双机编队进入到蓝方的导弹攻击区。此时,红方编队为破坏蓝方编队的咬尾和导弹攻击,在加速接近蓝方编队的同时迅速爬升摆脱蓝方编队的雷达跟踪,爬升到一定高度后,为占据高度优势,再向右上方做战斗转弯机动,随后导弹准备并对蓝方编队实施锁定,但由于准备与锁定时长不足,未能成功发射导弹;此时处于劣势的蓝方编队立即做最大过载右转机动,同时进行大过载爬升以重新占据高度优势,而后加速前飞行靠近红方编队并占领最佳攻击阵位,从而使蓝方的空空导弹性能得以最大限度地发挥,完成攻击占位。红方编队发现被蓝方编队锁定后,立即拉起做最大过载爬升机动,以摆脱蓝方编队空空导弹的锁定,并加速逃逸,脱离战斗,伺机重新攻击蓝方编队。
图5 双机编队对抗机动轨迹

Fig.5 Maneuvering trajectories of two aircraft formation

图6为对抗过程中红方双机编队相对于蓝方双机编队的优势函数值的变化曲线。由图6可知,在仿真开始后的前20 s内,R1B2R2B2的优势函数值在该仿真时段内整体要大于R1B1R2B1,故该时段内红方编队的战术策略为集中攻击蓝方战机B2,形成局部二打一的优势;2 s~30 s内,R1B1R2B1的优势函数值在该时段内明显大于R1B2R2B2,可知该时段内红方编队的战术策略转为集中攻击蓝方B1,同样形成二打一的局面;而后在20 s~120 s内,R1B1R2B2的优势函数值在该时段内要始终高于R1B2R2B1,可知该时段内红方编队的战术策略又转为R1专门攻击B1R2专门攻击B2,即最后形成了局部一对一的缠斗态势。由此可见,以上战术策略可以使红方编队的优势值保持最大化,即该策略可发挥出红方UCAV双机编队的最佳作战效能。
图6 红方编队对蓝方编队的优势函数值

Fig.6 Superiority function value of red formation versus blue formation

图7为对抗过程中蓝方双机编队相对于红方双机编队的优势函数值的变化曲线。由图7可知,在仿真开始后的前20 s内,B1R2B2R2的优势函数值在该仿真时段内整体要大于B1R1B2R1,故该时段内蓝方编队的战术策略为集中攻击红方战机R2,形成局部二打一的有利态势;20 s—25 s内,B1R2B2R1的优势函数值在该时段内要大于B1R1B2R2,可知该时段内蓝方编队的战术策略转为B1专门打击R2B2专门攻击R1,形成了局部一对一的攻击态势;25 s~30 s内B1R1B2R1的优势函数值在该时段内整体要大于B1R2B2R2,可知该时段内蓝方编队的战术策略转为集中攻击红方R2,同样形成二打一的局面;30 s~50 s内B1R2B2R1的优势函数值在该时段内始终大于B1R1B2R2,可知该时段内蓝方编队的战术策略再次转为B1R2B2R1,从而再次形成了局部一打一的局面;同理,50 s~70 s内蓝方编队的战术策略为集中攻击红方战机R1,再次形成局部二打一的态势;70 s~120 s内蓝方编队的战术策略转为B1R1B2R2,最终以一对一的局面结束对抗。由此可见,以上战术策略可以使蓝方编队的优势值保持最大化,从而发挥出蓝方UCAV双机编队的最佳水准。
图7 蓝方编队对红方编队的优势函数值

Fig.7 Superiority function value of blue formation over red formation

图8展示了红蓝方参与编队空战的四架战机的各自的空战目标攻击策略。4幅图中左上为红方战机R1的目标攻击选择策略,即R1为主体,选取对敌优势函数值最大的蓝方战机作为打击目标。具体策略为在仿真实验前20 s内R1的主要攻击目标为B2,而在20 s~120 s内R1则专门攻击B1;同理,右上为红方战机R2的目标攻击选择策略,前20 s内R2专打B2,20 s~30 s内R2转为专打B1,而后30 s~120 s内R2又转为专打B2;左下为蓝方战机B1的目标攻击选择策略,前25 s内B1主要攻击R2,25 s~30 s内B1转为攻击R1,30 s~50 s内B1专门攻击R2,随后50 s~120 s内B1专门攻击R1。右下为蓝方战机B2的目标攻击选择策略,前20 s内B2专门攻击R2,20 s~70 s内B2转为专门攻击R1,而后在70 s~120 s内B2又转为攻击R1。上述单机的目标攻击选择策略分别与图6中红方编队以及图7中蓝方编队的整体战术策略相一致。
图8 编队空战目标攻击选择策略

Fig.8 Target attack selection strategy in formation air combat

5 结束语

本文针对多机协同空战场景下的双机编队空战决策问题,有效结合空空导弹攻击区和不可逃逸区对传统的态势优势函数进行调整,提出了一种基于改进优势函数的多机编队空战机动决策方法。而后通过仿真实验来检验该方法的决策效果。仿真实验结果表明,该种方法可以根据空战态势的优劣实施多种机动决策,具有较好的可行性和稳定性。后续研究将引入多智能体深度强化学习方法引导UCAV多机编队通过不断交互和迭代来生成最优的空战策略。
[1]
章胜, 周攀, 何扬, 等. 基于深度强化学习的空战机动决策试验[J]. 航空学报, 2023, 44(10): 122-135.

ZHANG S, ZHOU P, HE Y, et al. Air combat maneuver decision-making test based on deep reinforcement learning[J]. Acta Aeronautica ET Astronautica Sinica, 2023, 44(10):122-135.

[2]
王芳杰, 黄鹏, 张子俊, 等. 基于矩阵博弈的近距空战自主机动决策方法[J]. 航空兵器, 2023, 30(6): 56-63.

WANG F J, HUANG P, ZHANG Z J, et al. A decision method for autonomous maneuver in close range air combat based on matrix game theory[J]. Aero Weaponry, 2023, 30(6): 56-63.

[3]
谢建峰, 杨啟明, 戴树岭, 等. 基于强化遗传算法的无人机空战机动决策研究[J]. 西北工业大学学报, 2020, 38(6): 1 330-1 338.

XIE J F, YANG Q M, DAI S L, et al. Air combat maneuver decision based on reinforcement genetic algorithm[J]. Journal of Northwestern Polytechnical University, 2020, 38(6): 1 330-1 338.

[4]
奚之飞, 徐安, 寇英信, 等. 基于改进粒子群算法辨识Volterra级数的目标机动轨迹预测[J]. 航空学报, 2020, 41(12): 349-369.

XI Z F, XU A, KOU Y X, et al. Target maneuver trajectory prediction based on Volterra series identified by improved particle swarm algorithm[J]. Acta Aeronautica et Astronautica Sinica, 2020, 41(12): 349-369.

[5]
孙庆鹏, 李战武, 寇英信. 能量理论在空空导弹攻击效果评价中的应用[J]. 火力与指挥控制, 2019, 44(10): 89-94, 100.

SUN Q P, LI Z W, KOU Y X. The application of energy theory in the evaluation of air-to-air missile attack effect[J]. Fire Control & Command Control, 2019, 44(10): 89-94, 100.

[6]
陈星, 王皖阳, 陈凤云, 等. 基于目标机动预测的空空导弹战术攻击区仿真研究[J]. 电光与控制, 2021, 28(1): 47-51, 60.

CHEN X, WANG W Y, CHEN F Y, et al. Simulation study on tactical attack area of air-to-air missile based on target maneuver prediction[J]. Electronics Optics & Control, 2021, 28(1): 47-51, 60.

[7]
游航航, 韩其松, 杨海燕, 等. 中距空空导弹不可逃逸区工程应用解算方法[J]. 战术导弹技术, 2020(2): 15-21.

YOU H H, HAN Q S, YANG H Y, et al. Engineering application calculation method of non-escape zone for medium range air-to-air missile[J]. Tactical Missile Technology, 2020(2): 15-21.

[8]
雷毅飞, 王露禾, 贺泊茗, 等. 基于深度强化学习的多无人机空战机动策略研究[J]. 航空科学技术, 2024, 35(3): 111-118.

LEI Y F, WANG L H, HE B M, et al. Research on multi-UAV air combat maneuver strategy based on deep reinforcement learning[J]. Aeronautical Science and Technology, 2024, 35(3): 111-118.

[9]
刘影, 魏潇龙, 屈虹, 等. 基于STPA方法的无人机空战态势分析与战术优化[J]. 指挥与控制学报, 2023, 9(6): 651-659.

LIU Y, WEI X L, QU H, et al. UAV air combat situation analysis and tactical optimization based on STPA method[J]. Journal of Command and Control, 2023, 9(6): 651-659.

[10]
王渊, 丁达理, 张鹏, 等. UCAV近距空战自适应态势评估方法研究[J]. 无人系统技术, 2023, 6(4): 85-94.

WANG Y, DING D L, ZHANG P, et al. Research on adaptive situation assessment method for UCAV close air-combat[J]. Unmanned Systems Technology, 2023, 6(4): 85-94.

[11]
谭目来, 朱文强, 刘远飞. 基于机动动作库的UCAV逃逸机动决策[J]. 无人系统技术, 2020, 3(4): 73-82.

TAN M L, ZHU W Q, LIU Y F. UCAV escape maneuver decision based on maneuver library[J]. Unmanned Systems Technology, 2020, 3(4): 73-82.

[12]
杜瑾, 邹坤, 张义飞. 近距空战中目标飞机战术机动数学模型建模与仿真[J]. 现代电子技术, 2024, 47(5): 29-34.

DU J, ZOU K, ZHANG Y F. Mathematical modeling and simulation of tactical maneuvers of target aircraft in close-range air combat[J]. Modern Electronics Technique, 2024, 47(5): 29-34.

[13]
王杰, 丁达理, 董康生, 等. UCAV自主空战战术机动动作建模与轨迹生成[J]. 火力与指挥控制, 2018, 43(12): 42-49.

WANG J, DING D L, DONG K S, et al. UCAV autonomous air combat tactical maneuvering modeling and trajectory generation[J]. Fire Control & Command Control, 2018, 43(12): 42-49.

文章导航

/