中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
理论研究

基于粒子群优化算法的舰机多设备组合搜潜决策方法

  • 郁红波 1 ,
  • 张驰 2 ,
  • 杨少伟 3
展开
  • 1.海军航空大学, 山东 烟台 264001
  • 2.中国人民解放军92810部队,海南 三亚 572000
  • 3.中国人民解放军91388部队, 广东 湛江 524000

郁红波(1996—),男,山东菏泽人,硕士研究生,研究方向为水下目标探测与识别。

张 驰(1982—),男,本科。

Copy editor: 许韦韦

收稿日期: 2020-08-02

  要求修回日期: 2020-08-15

  网络出版日期: 2022-05-11

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

Submarine Search Decision Method of Multi-Equipment Combination of Ship and Aircraft Based on POS Optimization Algorithm

  • YU Hong-bo 1 ,
  • ZHANG Chi 2 ,
  • YANG Shao-wei 3
Expand
  • 1. Naval Aviation university of PLA, Yantai 264001
  • 2. The Unit 92810 of PLA, Sanya 572000
  • 3. The Unit 91388 of PLA, Zhanjiang 524000, China

Received date: 2020-08-02

  Request revised date: 2020-08-15

  Online published: 2022-05-11

Copyright

Copyright reserved © 2022

摘要

为解决舰机多设备组合搜潜方案决策过程中指标权重完全未知的问题,提出了一种基于粒子群优化算法的博弈分析算法模型。首先确定多方案的决策矩阵,根据决策矩阵得出各个指标的指标序。然后将舰机多设备组合方案中的单个指标作为博弈中的局中人,以局中人的收益为适应度函数通过粒子群优化算法求取均衡策略剖面,通过均衡策略剖面与决策矩阵聚合,得出方案的优先顺序;最后计算决策方案序与指标序之间的相符度,称为博弈局中人的收益,得出收益最高的指标序作为舰机多设备组合搜潜方案的优先顺序。

本文引用格式

郁红波 , 张驰 , 杨少伟 . 基于粒子群优化算法的舰机多设备组合搜潜决策方法[J]. 指挥控制与仿真, 2020 , 42(6) : 41 -46 . DOI: 10.3969/j.issn.1673-3819.2020.06.007

Abstract

In order to solve the problem that the index weight is completely unknown in the decision-making process of shipboard and aircraft multi-equipment combined searching scheme, a game analysis algorithm model based on particle swarm optimization algorithm is proposed.Firstly, the decision matrix of multiple schemes is determined and the index order of each index is obtained according to the decision matrix.Then, a single index in the shipboard and aircraft multi-equipment combination scheme is taken as the player in the game, the player’s income is taken as the fitness function and the balanced strategy profile is obtained through particle swarm optimization algorithm, and the priority of the scheme is obtained through the aggregation of the balanced strategy profile and the decision matrix.Finally, the consistency between the order of the decision scheme and the order of the index is calculated, which is called the return of the player in the game, and the index order with the highest return is obtained as the priority of the search scheme of the combination of ships and aircraft and multiple equipment.

随着潜艇建造技术的发展,潜艇下潜深度不断增加,降噪技术越来越成熟,单基地设备搜潜已经无法满足现代复杂的搜潜任务,因此舰机多设备组合搜潜技术是海军反潜重要的发展方向。对于舰机多设备组合搜潜,在保证搜潜效能的同时,又要兼顾经济性和隐蔽性,因此选择最优的舰机设备组合搜潜方案势在必行[1,2,3]
舰机多设备组合方案博弈分析与确定性方案相比,具有复杂性,分析目标具有不确定性等问题,不易获得评价指标的权重信息,因此难以用权重已知的决策方法对舰机多设备组合方案进行计算和决策。对于多方案指标权重未知的问题,国内外也已开展了很多研究工作。汪伦焰在文献[4]中提出根据联系数理论,通过公式计算出联系数之间的距离,然后引进了相对相离度矩阵和相对相离度的定义,最后通过将区间数转化为联系数进行多属性决策;郭子雪等在文献[5]提出了基于离差最大化解决属性权重未知的方法,基于区间直觉模糊加权平均算子给出了属性权重未知情况下属性信息为区间直觉模糊数的多属性决策方法;代文锋在文献[6]中为了解决属性权重未知的多属性决策问题,运用前景理论得出了各个指标的二元前景值,并且建立了决策矩阵,根据主客观权重,计算得到指标的综合权重,基于扩展Multimoora算法对方案进行排序,最后运用占优理论进行最终的方案排序。本文针对属性权重未知多属性决策问题,提出了一种基于粒子群算法的博弈理论,通过粒子群算法的不断优化,求出均衡策略剖面,可以让各个属性在博弈中均能获得较好的收益,使得分析结果能够全面地反映各个属性包含的信息。

1 建立方案决策模型

1.1 确定舰机多设备组合搜潜方案集及评价指标集

现代反潜过程中有很多搜潜设备,针对不同的战场情况和敌我态势,通常使用单一的搜潜设备或者将搜潜设备两两组合形成主被动联合搜潜。主要的搜潜设备为声呐浮标(F),吊放声呐(D),拖曳声呐(S)。根据实际作战要求,形成如下方案集:U=(u1,u2,u3,u4)。
其中,各方案表示如下:
u1={F}为反潜直升机单独使用声呐浮标系统对潜艇进行搜索;
u2={D}为反潜直升机单独使用吊放声呐对潜艇进行搜索;
u3={F,D}表示拖曳声呐与吊放联合使用,通过吊放声呐发射声波,拖曳声呐接收声波进行主被动联合搜潜;
u4={S,F}表示拖曳声呐与声呐浮标主被动联合搜潜,拖曳声呐主动发射声波,浮标被动接收声波形成多基地搜潜方案。
对于上述的方案集,需要建立指标集对上述方案进行评价。考虑舰艇和航空反潜装备的特点,本文将从以下4个方面进行评价,评价指标集如下:P=(p1,p2,p3,p4)。
式中,p1为对潜搜索能力;p2为隐蔽能力;p3为跟踪及定位能力;p4为经济性。
通过建立方案集U和指标集P,可以得出舰机多设备组合搜潜方案决策结构,如图1所示。
图1 舰机多设备组合搜潜方案决策结构
方案ui在指标集pj上的指标值为yij(i=1,2,3,4;j=1,2,3,4),由指标值确定的矩阵为决策矩阵,记为A(yij)m×n,将矩阵A(yij)m×n规范化为矩阵R(rij)m×n,矩阵R(rij)m×n中的值蕴含着方案在各个指标集pj上的优劣顺序。
为消除不同指标集之间不同的量纲单位带来的不可公度性,可按下述规则将决策矩阵A(yij)m×n转变为规范化矩阵R(rij ) m × n [ 7 ]
根据不同类型的指标值属性,可将指标值属性分为成本型、固定型、效益型、区间型指标集。假设有m个方案,n个指标。
1)效益型指标
r i j = ( y ij - y min ) / ( y max - y min ) i = 1 , , m ; j = 1 , , n
式中,ymax为指标中的最大值;ymin为指标中的最小值。
2)成本型指标
r i j = ( y max - y j ) / ( y max - y min ) i = 1 , , m ; j = 1 , , n
式中,ymax为yij中的最大值;ymin为yij的最小值。
3)区间型指标
r i j = 1 - max { q 11 - y i j , y i j - q 12 } /   max { q 11 - y min , y max - q 12 }   i = 1 , , m ; j = 1 , , n
式中,ymax为yij的最大值; ymin为yij的最小值;q11、q12分别为区间的上下限。
4)固定型指标
r ij = 1 - | y ij - y j | / max ( | y ij - y j | ) i = 1 , , m ; j = 1 , , n
式中,yj为目标属性的最佳稳定值。

1.2 符号的定义

1)优先序位v。假设有m种方案,对应的m个优先序位的集合记为v={v1,v2,…,vm}。根据优先序位,可以判断方案的优先顺序。在优先关系ui1>ui2>…>uim中,uik在方案序列中称为第k优先序位。在优先序位集合中,v1的优先级最高,vm的优先级最低。
2) 指标方案序p·v。对于一个特定的指标pj,方案集ui都有一个对应的指标值rij(i=1,2,…m)。根据yij确定的优先关系ui1>ui2>…>uim,称为指标pj的指标方案序。pj的指标方案序可以表示为pj·v。其中,pj·vk=xik表示指标pj确定的方案序中xik处在第k优先序位。
3) 决策方案序w·v。w={w1,w2,…,wn}。其中,wi是第i个指标的重要性程度。利用加权算术平均(WAA)算子分别对方案u1,u2,…,un的每个评价指标值进行聚合,获得综合指标值。zi(w)=WAAw(ri1,ri2,…rim)= j = 1 mwjrij。通过计算,得出综合指标值的排列顺序z1(w)>z2(w)>…>zn(w)。根据综合指标值的排列顺序确定的优先关系称为决策方案序w·v。
4)有效策略剖面。有效策略剖面σ={w1,w2,…,wn},并且满足约束条件[9,10]如下:
w j 0 j = 1 n w j = 1
不符合约束条件的策略剖面称为无效策略剖面,因此,规定无效策略剖面的收益为0。
根据上述定义,舰机多设备组合搜潜博弈模型可以表示为<I,S,H>。其中,I表示各方案中的指标,即Ii=Yi;博弈策略S是对指标yi的权重wj进行赋值;H为博弈双方的收益矩阵,记为hj(σ),hj(σ)是决策方案序w·v和指标方案序p·v的相符度,记为Homo(w·v,pj·v)。
相同方案ui在序位v1vm上对相符度的贡献不同。为体现相同方案在不同序位上对相符度的贡献,本文引入序位权,序位v={v1,v2,…,vm}对应的序位权为q={q1,q2,…,qm}。假设最低优先级序位vm对应的序位权为qm,则序位权的表达式为
qi= j = i + 1 m q j×(m-1)+1=qi+1×m,(i=m-1,…,1)
序位权满足约束条件如下:
q j 0 j = 1 n q j = 1
5)均衡策略剖面。舰机多设备方案博弈均衡时的策略剖面为σ*,由σ*产生的决策方案序σ*·v与任何指标方案序pj·v的相符度满足:
Homo(σ*·v,pj·v)≥Homo(σ·v,pj·v)

2 舰机多设备组合搜潜博弈分析算法及粒子群优化算法

2.1 博弈分析算法

舰机多设备组合搜潜博弈分析算法主要包括方案评估,求取决策矩阵,求解均衡策略剖面,利用相符度进行方案优选4个步骤。
1) 方案评估。分析舰机多设备组合搜潜方案的优缺点,获得方案对应的指标值;
2) 求取决策矩阵。根据每个方案的指标值求取决策矩阵A(yij)m×n,根据指标集的属性求取规范化矩阵R(rij)m×n,并根据R(rij)m×n,获得指标序pj·v;
3) 求解均衡策略剖面。利用粒子群优化算法,求出均衡策略剖面σ*=w*=(w1*,w2*,…,wj*);
4) 利用相符度进行方案优选。首先,使用均衡策略剖面σ*对规范矩阵R(rij)进行聚合,得出综合指标值,从而得出决策方案序ui1>ui2>…>uim;然后,计算由σ*得出的决策方案序σ*·v与指标序pj·v的相符度Homo(σ*·v,pj·v)。
综上所述,要想对舰机多设备组合搜潜方案进行决策分析,要求出均衡决策剖面σ*和相符度Homo(σ*·v,pj·v)。
2.1.1 求解相符度
1)方案uiuj的相符度。
假设方案uiuj在决策方案序w·v的序位分别为v1mv2m。在指标方案序中,pj·v的序位为v1kv2k,则在决策方案序中w·v1m=ui,w·v2m=uj,在指标序中pj·v1k=ui,pj·v2k=uj。若是在决策方案序w·v和指标序中pj·v均有ui>uj,则称决策方案序w·v和指标序pj·v关于方案uiuj相符,其相符度定义为sub-hom o w · v , p j · v(ui,uj)=1,即博弈中收益为1,反之,决策方案集w·v和指标序中pj·v关于方案uiuj不相符,sub-hom o w · v , p j · v(ui,uj)=0,即博弈中收益为0。
2)w·vpj·v的相符度。
决策方案序w·v和指标序中pj·v之间的相符度定义为w·vpj·v关于pj·v中每个方案与其他低优先级方案的相符度的加权和[8]:
Homo(w·v,pj·v)= k = 1 m - 1 t = k + 1 mqk×sub-hom o w · v , p j · v(pj·vk,pj·vt)
式中,qk为方案pj·vk的所在序位的序位权。
2.1.2 求解均衡策略剖面
w·vpj·v之间的收益反映了决策方案序w体现指标pj包含信息量的大小,不同的w产生不同的决策方案序,决策方案序w·v不同,导致w·vpj·v之间的相符度不同。均衡策略剖面σ*是指各个决策方案序w·v和指标序pj·v之间具有较好的相符度,即收益。
pj·vw·v之间的相符度Homo(w·v,pj·v)称为剖面收益,假设 σ i *是一个策略剖面,指标pj(j=1,…,n)在策略剖面 σ i *下的收益为h( σ i *),不同指标在 σ i *下的收益不同,则pj σ i *所获剖面收益里最小值为策略剖面 σ i *的收益,为
h( σ i *)= min j = 1 , , n(hj( σ i *))
存在剖面σ*,对于任何指标pj(j=1,…,n)都有hj( σ i *)≥ max k(h( σ k *)),可以认定σ*为均衡策略剖面,由于策略剖面σ*={w1,w2,…,wj}中wi有不同的取值,因此求取均衡策略剖面σ*是一个多维最优解问题,适合利用粒子群优化算法进行求解。

2.2 粒子群优化算法

粒子群优化算法(Particle Swarm Optimization)是通过模拟群鸟寻找食物得出的一种基于群体合作的最优搜索算法。优化算法过程中每个优化问题的解都是空间中的一个粒子,所有粒子都会通过适应度函数解出当前粒子位置的适应度函数值,同时每个粒子还有一个速度决定粒子飞行的方向和距离,最后鸟群会根据全体最优适应值不停地更换飞行的速度和方向,在解空间中搜索得出最优值。粒子群算法具有搜索速度快,搜索效率高,算法较为简单,适合实值型等优点。
求解均衡剖面σ*的粒子群算法的流程如下:
Step1:进行策略编码,定义单个粒子σ={w1,w2,…,wn},式中,wj≥0, j = 1 nwj=1,wi表示指标的权值,在[-1,1]之间随机生成初始种群速度,粒子的维度dim=4,种群大小sizepop=100,迭代次数ger=300;
Step2: 定义适应度函数fitness-gbest(σ),种群中单个粒子的适应度便是剖面收益,即收益h(σj)=fitness-gbest(σj);
Step3: 初始化粒子群个体pop,计算各粒子历史最佳适应度,单个粒子的最佳历史位置,种群最佳历史位置,种群最佳历史适应度;
Step4:判断迭代次数是否满足设定的迭代次数,是则停止搜索,输出最优的结果,否则继续循环;
Step5:继续循环,对速度进行更新:
v id n + 1=w· v id n+c1·r1·( p id n- x id n)+c2·r2·( p gd n- x id n)
式中,惯性权重w=0.8,学习因子c1=0.5,c2=0.5,r1r2是两个在[0,1]范围内变化的随机数, p id n为粒子个体历史最佳位置, p gd n为相应的全局历史最优适应值, x id n为粒子的空间位置。根据新的速度进行粒子空间位置的更新,即
x id n + 1= x id n+ v id n + 1
粒子元素的位置变化范围和速度变化是有一定的界限的,分别被限制在[Xdmin,Xdmax]和[Vdmin,Vdmax]中,若某一维粒子元素idid超出边界值,则把超出边界的令其等于边界值;
Step6:通过更新后的粒子位置空间和移动速度,得出每个粒子新的适应度,通过与上一代适应度进行比较,大于上一代适应度,则对粒子最佳适应度进行更新,同时更新粒子历史最佳位置,如果小于上一代适应度,则保留粒子历史最佳适应度和历史最佳位置。同时求解种群最佳历史位置和最优适应度;
Step7:跳转至Step4。

3 示例验证及分析

在应召反潜的背景下,分别使用方案u1、u2、u3、u4对海域中的敌方潜艇进行搜索,方案u2、u3以扩展圆阵为例,方案u1、u4以圆形包围阵为例,利用Monte Carlo模型,仿真5 000次,得出了各个方案的搜潜效能,如表1所示。
表1 各方案的搜潜概率
方案 u1 u2 u3 u4
搜潜概率 49.6% 61.1% 83.2% 77.4%
通过表1可以发现,搜索能力u3>u4>u2>u1。在搜潜能力、隐蔽能力、跟踪及定位能力、经济性4个评价指标中,对潜搜索能力可以根据各设备组合方案的搜潜概率作为衡量标准,其他方案指标值可由专家给出评价,表2为各个方案因素指标。
表2 各方案因素指标
方案 指标
p1 p2 p3 p4
u1 较好 极好 一般 良好
u2 良好 一般 良好 极好
u3 极好 极好 较好
u4 良好 一般
为了对表2进行定量分析,便于后续的数学计算,本文引入评判标度,将表2中的评判语言进行数字化转换,评判标度如表3所示。
表3 评判语言与评判标度的对应关系
评价语言 一般 较好 良好 极好
评判标度 0 0.2 0.4 0.6 0.8 1
通过表3的评判标度将表2转化为表4,表4也是决策矩阵A(yij)m×n
表4 转换结果
方案 指标
p1 p2 p3 p4
u1 0.4 1 0.2 0.6
u2 0.6 0.2 0.6 1
u3 1 0.8 1 0.4
u4 0.8 0.6 0.8 0.2
由于在求取相符度和均衡策略剖面时均是以收益为衡量标准,因此将评估矩阵A(yij)m×n规范化为矩阵R(rij)m×n时,按照指标集属性为效益型来处理,根据效益型指标集处理方法得到规范化矩阵R(rij)m×n,如表5所示。
1) 确定方案指标序。对于规范化矩阵R(rij)m×n,可以得出最直观的指标方案序如下所示:
a) 指标p1:指标方案序为u3>u4>u2>u1;
b) 指标p2:指标方案序为u1>u3>u4>u2;
c) 指标p3:指标方案序为u3>u4>u2>u1;
表5 规范化矩阵R(rij)m×n
方案 指标
p1 p2 p3 p4
u1 0.25 1 0 0.5
u2 0.5 0 0.5 1
u3 1 0.75 1 0.25
u4 0.75 0.5 0.75 0
d) 指标p4:指标方案序为u2>u1>u3>u4
2) 求解均衡策略剖面:利用粒子群优化算法计算均衡策略剖面σ*时,相符度函数为适应度函数。求取相符度函数值时需要序位权值,如表6所示。
表6 序位权值
序位 q1 q2 q3 q4
权值 0.753 0.188 0.047 0.011 8
经过不断的迭代,以指标p1为例,得出了最佳适应度和平均适应度随迭代次数变化情况,如图2所示。
图2 经过500次迭代后的最优解和种群均值
3)均衡策略剖面的选择。利用粒子群优化算法,可以计算出不同指标值pi(i=1,…,n)下的均衡策略剖面 σ i *(i=1,…,n),均衡策略剖面的定义为,当进行博弈均衡时,决策方案序w·v和指标序pj·v之间都应该有很好的相符度,即博弈局中人能够获得最大收益。将均衡策略剖面 σ i *代入每个指标pi的相符度公式后,会得到指标pi在策略剖面 σ i *下的收益hi( σ i *),通过每个指标的收益hi( σ i *)计算总收益为
h( σ i *)= i = 1 nhi( σ i *)
根据公式(13),选择h( σ i *)最大时对应的 σ i *作为均衡策略剖面。
通过表7可以得出h3总( σ 3 *)>h4总( σ 4 *)>h2总( σ 2 *)>h1总( σ 1 *),因此,均衡策略剖面σ*= σ 3 *={0.171 5,0.449 9,0.074 8,0.303 8}。
表7 不同指标的相应参数
指标 参数
σ i * 最优解 h(σ*)
p1 {0.669 1,0.120 3,0.113 9,0.096 7} 2.690 4.414
p2 {0.223 7,0.310 7,0.416 0,0.049 6} 2.690 6.219
p3 {0.171 5,0.449 9,0.074 8,0.303 8} 2.690 7.631
p4 {0.211 6,0.216 3,0.070 1,0.502 0} 2.690 6.360
4)计算决策方案序。使用均衡策略剖面σ*对矩阵R(rij)m×n进行聚合,获得综合指标值z1=0.645,z2=0.427,z3=0.660,z4=0.410。根据综合指标值可以确定决策方案序w·vu3>u1>u2>u4
5)计算相符度。计算σ·v与指标序pi·v之间的相符度:
a)指标p1:Homo(σ·v,p1·v)=2.259;
b)指标p2:Homo(σ·v,p2·v)=0.941;
c)指标p3:Homo(σ·v,p3·v)=2.690 4;
d)指标p4:Homo(σ·v,p4·v)=0.800。
根据决策方案序w·v,舰机多设备组合方案搜潜的最优方案序为u3>u1>u2>u4,由4个指标因素得出的指标方案序中,指标p3确定的方案序u3>u4>u2>u1与最优方案序相符度较高,可作为舰机多设备组合搜潜的参考依据。在搜潜过程中,u3方案最佳,u1方案最差,因此优先选择u3组合进行搜潜。
在实际的搜潜过程中,吊放声呐与拖曳声呐组成的双基地联合搜潜模型可以提高搜潜效能,吊放声呐单基地搜潜时,搜潜效能要低于双基地搜潜。由于声呐浮标的被动工作方式,导致了其搜潜效能不佳,并且由于浮标的不可回收性,导致了u1方案的经济性较差;u4方案虽然可以提高搜潜效能,但由于浮标的不可回收性,导致其经济性不理想,而u3方案兼顾搜潜概率的同时,也具有很高的经济性,因此方案u3最佳。

4 结束语

本文根据现阶段搜潜的具体情况,建立了舰机多设备组合的搜潜方案,并且根据实际搜潜状况,给出了评价指标集。基于博弈理论,研究了多设备组合搜潜博弈分析算法,给出了求解多设备组合搜潜方案博弈模型均衡剖面的粒子群优化算法。以当今主流的搜潜设备为例,通过计算得到了各方案未知权重下组合的排列顺序,验证了本次决策方法的可行性和正确性。博弈分析结果表明:舰机多设备组合搜潜方案分析方法能够在权重等重要信息未知的情况下,通过博弈分析得出均衡策略剖面,然后根据均衡策略表面得出指标间的收益,进一步确定多方案的优先序列,为解决不确定条件下舰机多设备组合搜潜分析提供新的参考。
[1]
崔旭涛, 杨日杰, 何友. 多舰协同螺旋应召搜潜建模与仿真[J]. 舰船科学技术, 2010, 32(2):96-99.

[2]
张雨杭, 鞠建波, 李沛宗. 舰机协同下双基地声呐搜潜建模与效能仿真分析[J]. 中国电子科学研究院学报, 2019, 14(4):361-370.

[3]
张雨杭, 鞠建波, 范赵鹏. 舰机多设备组合搜潜方案决策方法研究[J]. 指挥控制与仿真, 2018, 40(6):93-98.

[4]
汪伦焰, 曹永超, 苏丽敏, 等. 属性权重未知的区间型多属性决策方法[J]. 数学的实践与认识, 2019, 49(14):299-305.

[5]
郭子雪, 林鹏. 属性权重未知情形下的区间直觉模糊多属性决策方法[J]. 河北大学学报(自然科学报), 2019, 39(1):1-5.

[6]
代文锋, 仲秋雁. 基于前景理论和区间二元语义MULTIMOORA的多属性决策方案[J]. 系统管理学报, 2019, 28(2):223-230.

[7]
宋光兴, 王应明. 运用离差最大化方法进行多指标决策与排序[J]. 系统工程与电子技术, 1998, 1(7):24-26.

[8]
贺平, 罗小明. 武器装备论证多方案博弈分析方法[J]. 装甲兵工程学院学报, 2013, 27(2):22-27.

[9]
王凯, 孙万国. 武器装备军事需求论证[M]. 北京: 国防工业出版社, 2008: 47-54.

[10]
胡运权, 郭耀煌. 运筹学教程[M]. 北京: 清华大学出版社, 2003: 385-388.

文章导航

/