中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
研究论文

面向巡飞弹编队的战前筹划任务分配方法

  • 曹成才 1 ,
  • 黄炎焱 1 ,
  • 孙鹏耀 1 ,
  • 吴奎 2
展开
  • 1 南京理工大学自动化学院, 江苏 南京 210014
  • 2 江苏自动化研究所, 江苏 连云港 222061

曹成才(1999—),男,硕士,研究方向为系统仿真。

黄炎焱(1973—),男,博士,教授。

Copy editor: 李楠

收稿日期: 2023-09-14

  修回日期: 2023-11-27

  网络出版日期: 2024-05-29

Prewar planning task assignment method for cruise missile formation

  • CAO Chengcai 1 ,
  • HUANG Yanyan 1 ,
  • SUN Pengyao 1 ,
  • WU Kui 2
Expand
  • 1 School of Automation, Nanjing University of Science and Technology, Nanjing 210014
  • 2 Jiangsu Automation Research Institute, Lianyungang 222061, China

Received date: 2023-09-14

  Revised date: 2023-11-27

  Online published: 2024-05-29

摘要

随着巡飞弹技术的广泛应用和执行任务的日益复杂,巡飞弹编队任务规划面临着新的挑战。以巡飞弹任务价值收益与任务损耗代价为优化目标,同时考虑任务执行时序等多种实际约束,构建基于多种约束条件的多巡飞弹战前筹划任务分配模型。为求解该模型,设计一种基于模拟退火的改进遗传算法,基于不同时期的种群适应度,调整自适应选择策略和自适应交叉策略,在保证收敛性的同时增加种群的多样性。最后通过案例验证所设计的改进算法在求解多巡飞弹任务分配问题上的有效性。

本文引用格式

曹成才 , 黄炎焱 , 孙鹏耀 , 吴奎 . 面向巡飞弹编队的战前筹划任务分配方法[J]. 指挥控制与仿真, 2024 , 46(3) : 56 -61 . DOI: 10.3969/j.issn.1673-3819.2024.03.009

Abstract

With the widespread application of cruise missile technology and the increasing complexity of mission execution, the mission planning of cruise missile formations is facing new challenges. A multi patrol missile pre war planning task allocation model based on multiple constraints is constructed, with the optimization objectives of mission value return and mission loss cost, while considering various practical constraints such as task execution timing. To solve the model, an improved genetic algorithm based on simulated annealing is designed, which adjusts the adaptive selection strategy and adaptive crossover strategy based on the population fitness of different periods, ensuring convergence while increasing population diversity. Finally, the effectiveness of the designed improved algorithm in solving the task allocation problem of multiple patrol missiles was verified through a case study.

巡飞弹由于其能在任务区域上方巡飞,执行侦察识别、精确打击、毁伤评估和中继通信等作战任务,还可扩展集群协同作战与自主智能作战能力,在俄乌冲突中频频亮相。随着无人化、智能化发展,巡飞弹通过多弹编组协同作战进行分布式侦察、协同决策、协同打击成为新的发展趋势[1-2]。巡飞弹编组在巡飞阶段对目标信息进行侦察识别和信息融合,通过多节点间控制系统,并基于火力规划策略确定规划作战任务,以实现打击目标、打击时间和打击弹药的最优方案。巡飞弹集群作战是未来网络化、无人化、精确化、智能化的军备武器的重要发展方向[3-4]
多巡飞弹任务分配问题,属于优化分配问题的一种,即针对不同目标各巡飞弹合理分配侦察和打击任务,以达到作战效益和资源消耗的最优组合。目前,对巡飞弹任务分配研究成果主要有:Schumacher等人以总航迹最短为目标,面向具体的使命任务实现高效协同任务分配[5];张传昊等人[6-7]基于合同网构建巡飞弹任务分配模型并进行求解;Nygard等人以集群侦控打评作战环为作战任务,利用最优化方法给出了协同决策最优任务匹配[8];周瑞等人[9-10]基于风险代价和攻击效益两个因素构建巡飞弹编队任务分配模型,并采用粒子群算法进行求解;Marjorie等人在编队任务分配问题中,利用遗传算法解决了巡飞弹编队协同任务分配问题[11]
由于目前任务分配方法无法满足信息化战争需求,为了适应巡飞弹编队的集群作战模式,进一步研究巡飞弹任务分配策略,本文引入巡飞弹航程、燃油损耗等消耗因素与任务毁伤敌方目标价值、任务完成程度等作战效益因素,结合基于模拟退火的改进遗传算法,规划出各巡飞弹对各目标执行侦察任务与打击任务的分配方案,达到作战效益和资源消耗的最优组合。

1 巡飞弹编组任务分配建模

1.1 问题描述

假设在某一作战区域内发现了m个敌方目标,目标集合表示为Target={T1,T2,…,Tm}。需要派出n个巡飞弹对敌方目标执行观测和打击任务,巡飞弹集合表示为Missiles={M1,M2,…,Mn}。巡飞弹均具有侦察和打击能力,可对多个目标依次进行侦察识别,但巡飞弹是自杀式攻击,仅可对单个目标执行打击任务。巡飞弹执行侦察任务需要消耗一定的时间、执行打击任务则消耗掉自身,同一目标上的同类型任务可以由多台巡飞弹协同完成。当目标群的侦察、打击任务均完成后,整个巡飞弹编队作战任务结束。模型中涉及的符号及相应说明如表1所示。
表1 符号说明

Tab.1 Symbol Description

类别 属性
巡飞弹 巡飞弹总数n
巡飞弹位置Poin t i M=(xi,yi)
巡飞速度Speedm
巡飞弹续航Durationi
巡飞弹i执行任务CK消耗的资源Consumeik
单巡飞弹对目标j最大侦察时间Timej
巡飞弹i健康状态Statusi
目标 目标数量m
目标位置Poin t j T=(xj,yj)
任务总个数C=2*m
目标价值Valuej

1.2 主要任务分配指标

巡飞弹任务分配,即对巡飞弹和敌方目标之间进行筹划分配,以达到用较小的巡飞弹损耗来实现给定任务的目的,且在巡飞弹执行任务过程中,地面目标对巡飞弹本身存在威胁。要建立巡飞弹任务分配模型,就需要对作战中对巡飞弹可能存在的影响以及巡飞弹任务完成程度等技术指标进行分析研究。因此,为了合理地对巡飞弹编队的火力规划方案结果进行评估,本模型采用了任务价值收益、任务损耗代价两个维度来评估方案优劣。

1.2.1 任务价值收益

任务价值效益是指巡飞弹执行打击任务后被打击目标损毁的价值。本文以巡飞弹对敌方目标群的毁伤价值为巡飞弹的任务价值收益。假设巡飞弹到各目标的距离相等,巡飞弹打击敌方目标的价值收益越高,该巡飞弹打击该目标的概率也就越大。该指标将任务分配向打击价值最大化的方向优化,使巡飞弹趋向于打击高价值目标。因此,巡飞弹编队对敌方目标j的任务价值收益可表示为
Fj= D P j V a l u e j m a x 1 j m V a l u e j D P j < D P m i n V a l u e j m a x 1 j m V a l u e j D P j D P m i n
其中,Valuej表示目标j的价值,DPj表示巡飞弹编队对目标j的毁伤概率,DPmin表示目标的毁伤阈值,定义如下:
DPj= 1 - ( 1 - D a m a g e j ) i = 1 n T a s k i , j F T
其中,Tas k i , j F T 表示巡飞弹i执行打击目标j任务与否,1表示执行打击任务,0表示未执行打击任务;Damagej表示巡飞弹对目标j的毁伤概率。

1.2.2 任务损耗代价

任务损耗代价定义为巡飞弹编队完成各自任务时的资源消耗总和。由于巡飞弹在目标附近巡飞时,巡飞时间过长会被敌方目标发现并击落,巡飞弹编队执行任务所消耗时间越短越好。因此,巡飞弹i的任务损耗代价可表示为
Ci= m a x 1 j m ( 1 - T a s k i , j F T ) T i m e i , j F T D u r a t i o n i + T a s k i , j F T   T i m e i , j S T e n d D u r a t i o n i
其中,Tim e i , j F T表示巡飞弹i对目标j火力打击的时刻,Tim e i , j S T e n d表示巡飞弹i对目标j侦察任务结束的时刻,Durationi表示巡飞弹续航时长。

1.3 目标函数

基于上述分析,多巡飞弹任务分配多目标优化问题转化为寻找下列目标函数的最优解问题:
min f=α(1- j = 1 mFj)+β 1 n i = 1 nCi
式中, F   j表示巡飞弹编队敌方目标j的任务价值收益,Ci表示巡飞弹i的任务损耗代价。

1.4 约束条件

1)任务总时长约束:巡飞弹有续航约束,因此,若某巡飞弹用于打击目标,则最后一枚执行火力打击任务的巡飞弹巡飞时刻必须小于巡飞弹续航:
m a x 1 j m(1-Tas k i , j F T) T i m e i , j F T D u r a t i o n i≤Durationi
2)任务执行时序约束:对于同一目标,巡飞弹首先要执行完成侦察任务,识别目标完成后,才能执行打击任务。因此,对同一目标的任务需要满足以下约束:
m a x 1 i n(Tim e i , j S T s t a r t)≤Tim e i , j S T e n d m i n 1 i nTim e i , j F T
其中,Tim e i , j S T s t a r t 表示巡飞弹i对目标j开始侦察的时刻,Tim e i , j S T e n d表示巡飞弹i对目标j侦察任务结束的时刻,Tim e i , j F T 表示巡飞弹i对目标j火力打击的时刻。
3)协同侦察时长约束:当巡飞弹组侦察所用时长达到识别所需时长Tim e j S T n e e d 后,巡飞弹对目标识别分析成功,才可以进入火力打击阶段。
i = 1 n(Tim e i , j S T e n d-Tim e i , j S T s t a r t)≥Tim e j S T n e e d
4)单巡飞弹侦察时长约束:巡飞弹执行目标侦察任务时,达到一定侦察时间后,敌方目标会发现并采取反制手段,进行隐蔽或击毁巡飞弹。因此,巡飞弹执行侦察任务时有如下约束:
0≤(Tim e i , j S T e n d-Tim e i , j S T s t a r t)≤Tim e j F T m a x
其中,Tim e j F T m a x 表示单巡飞弹对敌方目标j侦察任务时长上限。
5)打击约束:由于巡飞弹是自杀式攻击,每枚巡飞弹至多可对一个目标执行打击任务。
j = 1 nTas k i , j F T≤1
其中,Tas k i , j F T 表示巡飞弹i执行打击目标j任务与否,1表示执行任务,0表示未执行任务。

2 自适应模拟退火遗传算法设计

传统遗传算法具有较强的全局搜索能力,但对参数要求高,收敛速度慢并且容易陷入局部最优。本文对交叉算子和变异算子进行自适应优化,可以有效避免遗传算法陷入局部最优,保证种群多样性;模拟退火算法具有较强的局部寻优能力,具有稳健性和高效性。因此,将模拟退火算法与自适应遗传算法相结合,求解流程如图1所示。
图1 自适应模拟退火遗传算法流程

Fig.1 Adaptive Simulated Annealing Genetic Algorithm Process

2.1 编码

对巡飞弹侦察打击的目标次序为基因进行编码,以表示巡飞弹各阶段所消耗的资源以及目标。如图2所示,每条染色体可解码为可行方案空间中的一个解。
图2 染色体编码方式

Fig.2 Chromosome encoding method

编码表中的第一行为目标编号,由于作战阶段分为侦察过程和打击过程,因此,每一目标都会出现2次,本文通过奇偶来判断任务类型。第二行为巡飞弹编号,代表执行任务的巡飞弹,其中,由于巡飞弹为自杀式打击,在巡飞弹执行打击任务后,无法执行其他任务。第三行为消耗资源数,侦察阶段消耗的资源是侦察时间,是连续变量,打击阶段消耗的资源是巡飞弹本身,值为0或1,是离散变量。

2.2 初始化

在上述三维编码的基础上,提出基于约束处理的初始化方法,步骤如表2所示。
表2 初始化操作流程

Tab.2 Initialization Operation Process

初始化流程
步骤1:在目标集合中选择目标,每个目标有两次选中机会,分别表示侦察任务与打击任务:如果为侦察任务,跳转步骤2;如果为打击任务,跳转步骤3;
步骤2:在侦察巡飞弹集合中选择执行侦察任务的巡飞弹,优先选择执行任务少的巡飞弹,跳转步骤4;
步骤3:在打击巡飞弹集合中选择执行打击任务的巡飞弹,并在侦察巡飞弹集合和打击巡飞弹集合中删除该巡飞弹,跳转步骤5;
步骤4:设置巡飞弹侦察阶段的时长,如果目标被侦察总时长与侦察所需时长相等,跳转步骤1;否则,跳转步骤2;
步骤5:如果目标被打击总枚数与毁伤所需枚数相等,跳转步骤1;否则,跳转步骤3。
通过该方法得到的染色体是满足所有约束条件的可行解,能够有效避免由于任务时序导致的死锁状态[12]

2.3 基于罚函数的适应度函数

遗传算法经交叉变异产生新染色体时,可能会产生不可行解,如果直接抛弃不可行解,会降低种群的多样性,容易陷入局部最优。因此,引入罚函数思想,为每个违反约束条件的解分配一个惩罚值,将其与目标函数值相结合得到染色体适应度。适应度如下:
fit=f+γ k K βP
其中,f为目标函数,γβ为常数,K为总迭代次数,k为当前迭代次数,P为罚函数项。

2.4 自适应交叉、变异操作

在种群繁衍时,种群以一定的交叉概率对个体进行交叉操作,产生新的子类个体,针对不同阶段适应度的区别,自适应地调整交叉概率。交叉概率计算流程如表3所示。
表3 交叉操作流程

Tab.3 Cross operation process

交叉算子
步骤1:计算出最大个体适应度fitmax、种群平均适应度fitavg与代交叉的两个染色体中较大的适应度fitp
步骤2:将待交叉染色体中较大的适应度与种群平均适应度比较,根据结果不同设置不同交叉概率,如下:
PC= 0.80 f i t p < f i t a v g 0.8 * ( f i t m a x - f i t p ) / ( f i t m a x - f i t a v g ) e l s e
步骤3:结束。
由于任务之间有时序约束,本文采用OX交叉操作,产生具有父代特征的子代个体,促进种群的多样性。
种群每代经变异新生成的子代个体需要进行变异操作,以增强种群的多样性。变异操作会随机改变个体的某些基因值,引入新的解探索。针对不同时期种群适应度的特点,自适应地调整变异概率。变异概率计算流程如表4所示。
表4 变异算子流程

Tab.4 Mutation Operator Process

变异算子
步骤1:算出最大个体适应度fitmax、种群平均适应度fitavg与代变异染色体的适应度fitp;
步骤2:将待变异染色体的适应度与种群平均适应度比较,根据结果不同设置不同变异概率,如下:
Pm= 0.01 f i t p < f i t a v g 0.01 * ( f i t m a x - f i t p ) / ( f i t m a x - f i t a v g ) e l s e
步骤3:结束。
在该模型中,变异操作划分为两种:巡飞弹执行任务目标的变异和巡飞弹执行任务时长的变化。

2.5 模拟退火算法迭代

模拟退火算法是一种基于物理退火过程的全局优化算法,用于在搜索空间中寻找最优解。其基本思想是通过模拟物质退火时的温度变化过程,从一个高温状态开始,在搜索过程中逐渐降低温度,使系统逐步趋于稳定。算法步骤如表5所示。
表5 模拟退火算法步骤

Tab.5 Steps of Simulated Annealing Algorithm

模拟退火算法
步骤1:在当前温度下得到有遗传算法优化的新解;
步骤2:计算新解与上一温度的解之间的目标函数差异;
步骤3:如果目标函数值改善,则接受新解作为当前解,执行步骤5;如果目标函数值较差,执行步骤4;
步骤4:计算温度T下的概率P
P=eΔfit/KT-1
生成一个随机数a,如果a<P,那么接受这个解,否则放弃这个解;
步骤5:降低温度,执行遗传算法下一次迭代。
随着温度T的下降,即随着迭代次数的上升,逐渐减少接受劣解的概率,并最终趋于零,使算法收敛到全局最优解。

3 案例分析

为了验证巡飞弹编队的火力规划方案的有效性,本文针对巡飞弹编队典型想定案例进行仿真验证。

3.1 想定概述

红军R在某次作战任务中对蓝军B所在区域A进攻,蓝军在作战区域内有若干目标。红方利用卫星图像及北斗全球定位系统已初步获得蓝方目标的数量及位置。现急需对巡飞弹编队的具体作战方案进行协同规划,以最优方案完成编队作战使命任务。
假设战场任务区域有10个敌方目标。设定同构巡飞弹数量为20枚,由位于(0,0)的载具发射。设巡飞弹所携带的探测器识别距离为2 km,其巡飞速度为30 m/s。每个目标包含以下属性:目标位置、识别所需时长、目标毁伤概率、目标价值,如表6所示。
表6 目标属性值

Tab.6 Target Attribute Values

目标编号 目标位置 侦察所需时长 目标毁伤概率 目标价值
1 (10,15) 360 0.82 10
2 (13,14) 420 0.9 9
3 (5,6) 400 0.71 7
4 (5,10) 300 0.9 10
5 (10,10) 500 0.82 8
6 (12,7) 450 0.71 9
7 (11,15) 450 0.82 8

3.2 结果分析

为了验证搜索算法的有效性,本文将遗传算法、自适应遗传算法和自适应模拟退火遗传算法进行仿真对比研究,如图3所示。
图3 各算法迭代曲线

Fig.3 Iteration curves of each algorithm

图3可以看出,自适应模拟退火遗传算法较其他算法能获取更好的方案,并且收敛更迅速。自适应模拟退火遗传算法求解任务分配的最终方案如表7所示。
表7 巡飞弹编队任务分配结果

Tab.7 Task allocation results of patrol missile formation

侦察阶段 打击阶段
巡飞弹1 侦察目标1(176秒) 目标1
巡飞弹2 侦察目标2(121秒)→侦察目标7(26秒)
巡飞弹3 侦察目标1(119秒)→侦察目标6(40秒) 目标4
巡飞弹4 侦察目标5(42秒)→侦察目标1(32秒)→侦察目标7(10秒)
巡飞弹5 侦察目标5(47秒)→侦察目标2(45秒)→侦察目标7(42秒) 目标7
巡飞弹6 侦察目标5(125秒) 目标5
巡飞弹7 侦察目标7(165秒)
巡飞弹8 侦察目标4(71秒)→侦察目标2(11秒)→侦察目标6(64秒) 目标3
巡飞弹9 侦察目标5(37秒)→侦察目标6(101秒) 目标2
巡飞弹10 侦察目标6(26秒)→侦察目标7(84秒)
巡飞弹11 侦察目标3(64秒)→侦察目标5(28秒)→侦察目标1(19秒)→侦察目标2(30秒) 目标2
巡飞弹12 侦察目标5(146秒) 目标5
巡飞弹13 侦察目标3(86秒)→侦察目标4(62秒) 目标4
巡飞弹14 侦察目标3(107秒)→侦察目标4(54秒) 目标4
巡飞弹15 侦察目标3(53秒)→侦察目标2(105秒) 目标2
巡飞弹16 侦察目标4(63秒)→侦察目标6(86秒)→侦察目标7(24秒) 目标7
巡飞弹17 侦察目标5(32秒)→侦察目标6(44秒)→侦察目标7(49秒) 目标7
巡飞弹18 侦察目标3(41秒)→侦察目标4(48秒)→侦察目标6(85秒) 目标6
巡飞弹19 侦察目标3(62秒)→侦察目标5(11秒)→侦察目标2(35秒)→侦察目标7(45秒)
巡飞弹20 侦察目标5(57秒)→侦察目标2(51秒)→侦察目标1(20秒) 目标1
表7可知,自适应模拟退火遗传算法最终任务执行总时长为625 s,且完成编队作战任务使命。遗传算法得到任务规划结果执行总时长为776 s,且未完成编队作战任务。自适应遗传算法虽完成编队作战任务,但执行任务规划结果执行总时长为721 s。可见,本文提出的面向巡飞弹编队的战前筹划任务分配方法能提高编队任务完成程度,且相较遗传算法与自适应遗传算法分别缩短巡飞弹编队24.4%、15.3%的工作时长。

4 结束语

针对巡飞弹编队的战前筹划任务分配问题,本文充分考虑战场环境的复杂性,构建了一套包含多种约束条件的巡飞弹编队协同多任务分配模型。然后,基于滚动优化思想,采用自适应模拟退火遗传算法的双层启发式算法进行优化求解。仿真结果表明,该模型具有可行性和实用性,能够有效地对巡飞弹编队进行任务分配,解决了巡飞弹编队的战前筹划任务分配问题。
[1]
李朝龙, 程呈, 冷伟峰, 等. 俄乌冲突中 “弹簧刀” 巡飞弹制导分析与思考[J]. 激光与红外, 2023, 53(2): 163-168.

LI C L, CHENG C, LENG W F, et al. Analysis and reflections on guidance technology of “Switchblade” patrol missile in Russia Ukraine conflict[J]. Laser & Infrared, 2023, 53(2): 163-168.

[2]
李辉, 方丹, 高伟伟, 等. 巡飞弹蜂群关键技术与战术构想研究[J]. 战术导弹技术, 2020(4): 58-63.

LI H, FANG D, GAO W W, et al. Research on key technology and tactical conception of loitering munitions swarm[J]. Tactical Missile Technology, 2020(4): 58-63.

[3]
孙骑. 巡飞弹的分类及发展概述[J]. 中国军转民, 2022(18): 67-68.

SUN Q. Overview of the classification and development of patrol missiles[J]. Chinese Military to Civilian Conversation, 2022(18): 67-68.

[4]
吴蔚楠. 巡飞弹协同攻击任务规划问题建模与方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2013.

WU W N. Research on modeling and method of mission planning for cooperative attack of cruise missiles[D]. Harbin:Harbin Institute of Technology, 2013.

[5]
SCHUMACHER C, CHANDLER P R, RASMUSSEN S R. Task allocation for wide area search munitions via iterative network flow[C]. Proc of the AIAA Guidance Navigation and Control Conference, 2002.

[6]
张传昊, 李豪杰, 于航, 等. 基于合同网的巡飞弹任务分配算法及模型[J]. 探测与控制学报, 2023, 45(1): 84-90.

ZHANG C H, LI H J, YU H, et al. Task assignment algorithm for cruising munition based on contract net[J]. Journal of Detection & Control, 2023, 45(1): 84-90.

[7]
唐苏妍, 梅珊, 朱一凡, 等. 基于扩展合同网协议的分布式武器目标分配方法[J]. 系统工程与电子技术, 2011, 33(3): 568-574.

TANG S Y, MEI S, ZHU Y F, et al. Distributed weapon target assignment algorithm based on extended contract net protocol[J]. Systems Engineering and Electronics, 2011, 33(3): 568-574.

DOI

[8]
NYGARD K E, CHANDLER P R, MEIR P. Dynamic network flow optimization models for air vehicle resource allocation[C]. Proc of the American Control Conference, 2001: 1 853-1 858.

[9]
周瑞, 黄长强, 黄汉桥, 等. 多巡飞弹协同攻击目标优化分配研究[J]. 计算机仿真, 2017, 34(8): 110-114, 416.

ZHOU R, HUANG C Q, HUANG H Q, et al. Collaborative research target optimization allocation for multi-loitering missile[J]. Computer Simulation, 2017, 34(8): 110-114, 416.

[10]
王峰, 黄子路, 韩孟臣, 等. 基于KnCMPSO算法的异构无人机协同多任务分配[J]. 自动化学报, 2023, 49(2): 399-414.

WANG F, HUANG Z L, HAN M C, et al. A knee point based coevolution multi-objective particle swarm optimization algorithm for heterogeneous UAV cooperative multi-task allocation[J]. Acta Automatica Sinica, 2023, 49(2): 399-414.

[11]
MARJORIE D, WILLIAM N, LANCE W. UAV cooperative task assignments for a SEAD mission using genetic algorithms[C]. Proc of the AIAA Guidance Navigation and Control Conference, 2006.

[12]
EDISON E, SHIMA T. Integrated task assignment and path optimization for cooperating uninhabited aerial vehicles using genetic algorithms[J]. Computer and Operations Research, 2011, 38(1): 340-356.

文章导航

/