中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Theory & Research

Intelligent Prediction Method of Engaged Firepower Units for Cognitive Modeling of Wargames

  • ZHAO Wen-dong 1, 2 ,
  • ZHANG Ming-zhi 1 ,
  • HE Xiao-yuan 1 ,
  • GUO Sheng-ming 1
Expand
  • 1. Joint Operations College, National Defence University, Beijing 100091
  • 2. Unit 61267 of PLA, Beijing 101114, China

Received date: 2021-11-04

  Revised date: 2021-12-06

  Online published: 2022-08-16

Abstract

In order to adapt to needs of intelligent wargame system research, it proposes two intelligent prediction methods of engaged firepower units for cognitive modeling of wargames. The first approach is based on knowledge graph representation learning. It decomposes the knowledge graph into attribute subgraphs, the features of firepower units in each subgraph are extracted by using neural network model, the prediction is made by calculating the correlation between targets and firepower units. The second approach is based on the fusion of knowledge graph and the operational behavior of firepower units. It uses gated recurrent unit and attention mechanism to model the operational behavior of firepower units, the feature vector of firepower units extracted from the knowledge graph is input into the behavior model to obtain the behavior feature of firepower units, finally we predict which firepower units will be engaged. Experimental results show that the proposed methods can effectively predict the firepower units that will carry out the strikes.

Cite this article

ZHAO Wen-dong , ZHANG Ming-zhi , HE Xiao-yuan , GUO Sheng-ming . Intelligent Prediction Method of Engaged Firepower Units for Cognitive Modeling of Wargames[J]. Command Control and Simulation, 2022 , 44(4) : 42 -47 . DOI: 10.3969/j.issn.1673-3819.2022.04.007

计算机兵棋系统作为研究战争和训练指挥员的重要平台,正朝着智能化的方向发展。火力打击行动作为信息化战争中的主要作战行动之一,往往贯穿作战全程,指挥员运用兵棋系统进行对抗推演时,兵棋系统如果能够在一定程度上智能地预测出对手实施火力打击行动所运用的火力单元,可辅助己方推演人员全面掌握战场态势,做出最优决策,实施先制作战。当前,对敌方行动进行预测的推理方法主要有D-S证据理论[1]、模板匹配[2-3]、贝叶斯网络[4]和神经网络[5-6]等方法,它们主要应用于单一军兵种的战术和战斗层级作战,通过获得实时、准确、完整的态势信息进行推理。然而,当运用兵棋系统进行大规模的诸军兵种联合作战推演时,推演过程中充满了“战争迷雾”,获得的态势信息通常不及时、不准确、不完整,导致上述方法难以奏效。
人类指挥员的经验知识和指挥行为蕴含在兵棋推演的历史数据中,对“人在回路”的兵棋推演历史数据的挖掘和利用是实现兵棋智能化的有效途径[7-9]。文献[7]运用深度学习方法对战役级兵棋演习数据进行特征提取,取得了较好的效果;文献[8]运用关联规则算法对陆军合同战术兵棋演习数据进行挖掘,获取了指挥员对武器的运用规律;文献[9]从战术兵棋演习数据中提取多项关键评价属性,并利用多属性评价算法和兵棋规则智能地确定棋子的行动。知识图谱作为一种可计算模型,可用于智能化兵棋系统模型的构建[10-11]。文献[10]指出智能化兵棋的主要特征是“神经元网络+认知计算”,将基于决策场景构建的知识图谱与实时态势相结合进行推理,可提高兵棋智能体的认知能力;文献[11]提出基于兵棋推演场景构建的知识图谱,可以为智能体认知决策提供类脑化服务。
受上述文献的启发,为满足兵棋推演智能化发展和认知建模的需要,本文尝试引入知识图谱表示学习和神经网络技术,提出两种交战火力单元智能预测方法,分别为基于知识图谱表示学习的交战火力单元预测方法(简称FKG)和融合火力单元运用行为的交战火力单元预测方法(简称FKG-GA)。基于知识图谱表示学习的预测方法以想定场景下的“人在回路”战役级兵棋推演历史数据为基础,并结合军事专家知识构建火力单元知识图谱,运用图表示学习算法获得火力单元的特征表示,通过计算目标与火力单元之间的相关性进行预测。融合火力单元运用行为的预测方法将知识图谱作为辅助信息,采用循环神经网络和注意力机制来建模火力单元的运用行为,将火力单元知识图谱表示学习得到的火力单元特征向量输入行为模型得到更为合理的特征表示,预测每个火力单元与目标交战的概率。

1 基于知识图谱表示学习的预测方法

利用知识图谱预测交战火力单元的关键在于如何从大量的异构信息中确定火力单元与目标的相关性。为解决这一关键问题,首先,从兵棋推演历史数据中抽取火力单元数据,构建具有不同属性类别的火力单元知识图谱;然后,将火力单元知识图谱分为不同的属性子图,运用深度学习方法进行表示学习,得到火力单元的特征表示;最后,将不同属性子图上得到的火力单元特征表示进行集成,并计算出目标与火力单元的相关性。

1.1 构建知识图谱

知识图谱是以图的形式展现实体、概念及其之间的相互关系的语义网,网络中的节点表示实体或概念,边表示关系或属性,蕴含丰富的知识[12]。运用知识图谱对各火力单元及其之间的多种关系建模,可以为交战火力单元的预测提供丰富的信息。知识图谱的构建应和具体的应用相结合,从兵棋推演历史数据中抽取指挥员运用火力单元的各种信息后,根据军事专家经验知识将火力单元所属的部(分)队专业类型、使用的弹药类型和打击的目标类型作为火力单元的属性类别,部(分)队专业类型的属性值包括无人攻击机部(分)队、轰炸机部(分)队和岸舰导弹部(分)队等数十种,弹药类型的属性值包括巡航导弹、空地导弹和远程火箭弹等数十种,目标类型的属性值包括部队、作战工事和武器平台等数十种。将火力单元和属性值作为知识图谱中的节点,属性类别作为连接火力单元节点和属性值节点之间的边,构建如图1所示的知识图谱。构建的知识图谱用符号可描述为G=(V,E),V为节点集合,代表图中的火力单元和具体的属性值;E为边集合,代表图中火力单元的属性类别。
图1 知识图谱示例

1.2 知识图谱表示学习

知识图谱表示学习的目的是将其中的火力单元节点映射到稠密低维的向量空间,从而有效地计算出火力单元之间的语义关联,提升对交战火力单元的预测能力。本文构建的知识图谱具有三种不同的属性类型,不同的类型属性具有不同的语义值,不同程度地影响节点的特征表示,参考文献[13],将知识图谱分为部队专业类型属性子图、弹药类型属性子图和目标类型属性子图分别进行表示学习。
本文采用Node2vec方法对属性子图进行表示学习,它可以把具有相同属性和相似结构的节点聚合在一起[14]。首先,通过随机游走生成子图中的节点序列,然后,运用神经网络语言模型得到火力单元在对应属性类空间下的特征向量,子图中拥有更多相同属性的火力单元在特征空间中的距离更为相近。子图表示学习的过程如图2所示。
图2 子图表示学习过程
1)节点序列生成
本文采用有偏的随机游走的方法生成子图中的节点序列。在子图Gr=(Vr,Er)中,给定一个起始火力单元节点v(0)Vr开始随机游走,如果在第t步从v(t-1)游走至节点v(t),那么,下一个游走的节点将从v(t)的邻居节点中以如下概率选出:
p(v(t+1)|v(t))= a p q ( v ( t + 1 ) | v ( t - 1 ) , v (t) ) Z , ( v ( t + 1 ) , v ( t - 1 ) ) N ( v (t) ) 0 , o t h e r w i s e
式中,N(v(t))表示节点v(t)的邻居节点集合,Z为正则化常数,apq(v(t+1)|v(t-1),v(t))为从邻居节点中选择下一个节点的概率,可表示为
apq(v(t+1)|v(t-1),v(t))= 1 p , d i s t ( v ( t - 1 ) , v ( t + 1 ) ) = 0 1 , d i s t ( v ( t - 1 ) , v ( t + 1 ) ) = 1 1 q , d i s t ( v ( t - 1 ) , v ( t + 1 ) ) = 2
式中,dist(v(t-1),v(t+1))表示节点的最短路径,pq为超参数,二者分别控制立刻访问节点以及访问节点邻居的概率。若p较小,则倾向于返回之前访问过的节点,若p较大,则倾向于游走至其他节点。若q>1,倾向于游走至接近v(t-1)的节点,若q<1,倾向于远离v(t-1)的节点。
2)节点特征学习
对随机游走生成的序列中的节点进行One-Hot编码后,输入神经网络语言处理模型Skip-gram模型,通过最大化两个火力单元节点在生成序列中的共现概率,来得到节点的特征向量。节点向量化问题转化为如下最优化问题:
m i n i m i z e Φ-logPr({vi-w,…,vi+w}\vi|Φ(vi))
式中,w表示火力单元序列中上文窗口的大小,Pr表示给定一个节点vi,存在节点序列中某节点的条件概率。基于序列中节点独立性假设,可得
Pr({vi-w,…,vi+w}\vi|Φ(vi))= j = i - w , j i i + wPr(vj|Φ(vi))
运用负采样方法,将式(4)转化为
m i n i m i z e Φ logσ(Φ(vj)TΦ(vi))+ v t N ( v i ) ' logσ(-Φ(vt)TΦ(vi))
式中,N(vi)'为节点vi的负采样;σ()为sigmoid函数,σ(x)=1/(1+exp(-x))。
采用梯度下降法求解上式,即可得到火力单元节点的特征向量。

1.3 相关性计算

在获得每个属性子图中的火力单元特征向量后,使用公式(6)将每个火力单元在3个属性子图中的特征向量进行集成,可得到最终的火力单元特征向量。
v i f= 1 3 k = 1 3 v i k
式中, v i k表示属性子图中的火力单元特征向量, v i f表示集成后的火力单元特征向量。
目标的特征向量由公式(7)计算得到,其中,Nt是打击过目标t的火力单元集合;ρiNt是打击过目标t的某个火力单元; v ρ i f为打击过目标t的火力单元的特征向量。
vt= 1 | N t | ρ i N t v ρ i f
当得到火力单元和目标的特征向量后,采用公式(8)计算目标与不同交战火力单元之间的相关性,从而预测出交战的火力单元。sim()函数可以是欧氏距离、皮尔逊相关系数和余弦相似度等计算公式。
R(vf,vt)=sim(vf,vt)

2 融合火力单元运用行为的预测

虽然基于知识图谱表示学习可以预测出交战的火力单元,但没有考虑联合作战中火力单元的运用行为的特点,因此,存在一些不足。联合作战中对目标实施打击时,单一的火力单元往往难以达到打击效果,因此,需要根据所要达到的打击效果,将立体分布的不同类型火力单元优化组合,按时序区分多个波次对目标实施连续打击,具有序列性特征。具有不同属性的目标的毁伤机理不同,需要使用与目标特征相匹配的火力单元进行打击,才能达到最佳打击效果,因此,在对目标实施打击过程中会重点使用特定类型的火力单元,具有倾向性特征。

2.1 火力单元运用行为建模

循环神经网络(RNN)具有记忆功能,适合处理序列数据并利用其中的信息。门控循环单元(GRU)网络是在循环神经网络的基础上,引入门控机制进行改进的一种网络,其有效地改善了循环神经网络存在的长程依赖问题,并且结构简单,需要训练的参数少,训练速度快[15-16],因此,本文采用门控循环单元(GRU)网络对火力单元运用的序列进行建模,以获得火力单元运用序列之间的依赖关系。注意力机制借鉴人类大脑对信息的处理方式,通过分配权重系数从多种信息中突出与当前任务更相关的关键信息,抑制无用信息[15,17],因此,采用注意力机制衡量各个火力单元的重要程度,以提取不同火力单元运用的倾向性。网络结构如图3所示。
网络输入为针对特定目标实施火力打击的火力单元特征向量序列,记为 v s e q f=[ v 1 f, v 2 f,…, v n f],GRU网络的更新算法为:
zn=σ(Wz v n f+Uzhn-1+bz)
rn=σ(Wn v n f+Unhn-1+br)
$\widetilde{{{h}_{n}}}\text{=}=tanh({{W}_{h}}v_{n}^{f}+{{U}_{h}}({{r}_{n}}{{h}_{n}}_{-1})+{{b}_{h}})$
${{h}_{n}}={{z}_{n}}{{h}_{n}}_{-1}+(1-{{z}_{n}})\widetilde{{{h}_{n}}}$
式中,hn-1为输入第n个GRU的历史状态;hn为第n个GRU的输出状态;σ为sigmoid激活函数; $\widetilde{{{h}_{n}}}$表示候选状态;rn为重置门,控制 $\widetilde{{{h}_{n}}}$hn-1的依赖程度,重置门越小,前面所运用火力单元对后续火力单元的影响越小;zn为更新门,控制前一个GRU单元输出hn-1的保留量以及当前输入 的接受量。
为提取不同火力单元的重要程度,引入注意力机制为每一个GRU输出的状态分配权重系数,表达式如下:
s= j = 1 nαjhj
αj=softmax( h T jq)
式中,q为随机初始化向量;hj为GRU的输出状态;αj为权重系数;s为采用注意力机制后输出的特征向量,即打击某目标的火力单元的最终特征向量。

2.2 损失函数

针对某目标,给定待预测的m个火力单元特征向量集合{ v 1 f, v 2 f,…, v m f},将其中每一个特征向量与s进行内积,然后,运用softmax函数归一化,即可得到对该目标进行打击时,运用每个火力单元的概率如下:
gt=sT v t f
$\hat{y}=softmax(g)$
其中, 为集合中第t个火力单元的特征向量,gt为运用第t个火力单元的分数,g为待预测的m个火力单元分数, $\hat{y}$m个火力单元的概率。
本文将预测任务定义为分类问题,采用负对数似然函数作为损失函数来优化模型,可表示为
$L=-\overset{m}{\mathop{\underset{t=1}{\mathop \sum }\,}}\,{{y}_{t}}\text{log}({{\hat{y}}_{t}})+(1-{{y}_{t}})log(1-{{\hat{y}}_{t}})$
式中,yt∈{0,1}表示真实的火力单元标签;0代表目标未被该火力单元打击,1代表打击。 ${{\hat{y}}_{t}}\in [0,1]$为模型的输出,表示交战火力单元的概率。采用反向传播算法,最小化上述损失函数,直至收敛,即完成模型优化。

3 实验分析

3.1 实验条件及数据准备

本文的实验条件:Intel(R) Core(TM) i7-10750HCPU@2.6GHz处理器和16 GB内存,编程平台为Pycharm,运用Python编程语言,在深度学习框架Pytorch下搭建神经网络。实验数据样本来源于“人在回路”的兵棋推演历史数据。在兵棋推演历史数据中,若一个目标被打击的次数少于2,则滤除打击该目标的火力单元;将打击同一目标的火力单元按时间排序后,得到对该目标实施打击的火力单元序列。为减少数据样本稀疏的不良影响,参考文献[18]的处理方式,对于打击每一个目标的火力单元序列( v 1 f, v 2 f,…, v n f),生成序列集合{( v 1 f, v 2 f),( v 1 f, v 2 f, v 3 f),…,( v 1 f, v 2 f,…, v n f)},集合中的每一项都作为打击该目标的火力单元序列,每一项的最后一个火力单元作为待预测的火力单元。

3.2 评价指标

本文采用命中率(Hit@K)指标和平均倒数排名(MRR@K)来评估火力单元预测方法的有效性,预测方法的效果与二者数值大小成正相关关系。 Hit@K是正确的火力单元在预测结果排序列表前K项所占的比例;MRR@K是正确的火力单元在预测结果排序列表前K项中排名的倒数之和的平均值,如果正确的火力单元未出现在前K项中,将该项的倒数设为0。计算公式如(18)、(19)所示,实验中,K值设定为15。
Hit@K= 1 Q i = 1 QN(ranki)
MRR@K= 1 Q i = 1 Q 1 r a n k i
式中,Q表示样本集合;|Q|表示样本的个数;ranki表示第i个样本正确结果在预测结果排序列表前K项的排名,如果rankiK,则N(ranki)=1,否则N(ranki)=0。

3.3 比较方法及实验参数设定

本文采取的比较方法有POP、LSTM[15]和Node2vec,POP方法直接从训练集中选取出现次数最多的火力单元作为预测结果;LSTM方法不利用知识图谱作为辅助信息,仅从火力单元的运用行为中提取出序列特征进行预测;Node2vec方法未将知识图谱根据属性类别分解为属性子图,在整个知识图谱上提取节点的特征表示进行预测。
在实验中设置随机游走的长度l=30,p=0.5,q=0.25,设置滑动窗口大小w=15,设置向量维度d=150,学习率α=0.01,批量训练样本数batch-size=50。

3.4 预测效果分析

1)方法比较
不同方法的预测效果如表1所示。从表中可以看到,本文所提的方法均优于对比方法,并且FKG-GA方法优于FKG方法,这是因为FKG-GA方法在FKG方法的基础上对火力单元的运用行为进行了建模。POP方法仅根据火力单元运用的频繁程度进行预测,效果最差。LSTM方法效果较差,它虽然能捕捉到火力单元运用的序列特征,但没有利用知识图谱提供的语义信息,难以达到很好的效果。Node2vec方法虽然运用了知识图谱中的语义信息,但它是在整个知识图谱上提取火力单元的特征表示,获得的语义信息不如本文所提的FKG方法全面,因此,效果不理想。
表1 实验结果对比
方法 Hit@15 MRR@15
POP 28.21 9.13
LSTM 30.34 11.31
Node2vec 35.32 12.54
FKG 40.13 13.37
FKG-GA 43.31 15.34
2)不同序列长度下预测效果分析
火力单元序列不同长度的预测结果如图4图5所示。从图中可以看出,随着序列长度的增加,5种方法的预测效果均有所提升。POP方法预测效果的提升是因为在兵棋推演过程中,指挥员针对某一目标,会更加频繁地运用某些特定的火力单元,在序列长度为4时,POP方法与LSTM方法预测结果的差距较小,是因为在序列长度较短时,无法为序列模型提供足够的信息。不同序列长度下,Node2vec方法和FKG方法预测结果均优于LSTM方法,并且在序列长度为12时,FKG方法的Hit@15值与FKG-GA方法差距较小,说明知识图谱提供的信息在交战火力单元预测中起了重要的作用。
图4 不同序列长度下的Hit@15
图5 不同序列长度下的MRR@15

4 结束语

本文提出了基于知识图谱表示学习和融合火力单元运用行为的交战火力单元预测方法。前者将知识图谱分解为属性子图分别进行表示学习,有效地提取了知识图谱中火力单元的特征,通过计算目标与火力单元的相关性进行预测;后者对火力单元的运用行为进行建模,将知识图谱作为火力单元运用行为模型的辅助信息进行预测。实验结果表明,本文所提两种方法提高了预测的准确度。下一步将从两方面进行深入研究,以进一步提高预测的准确度:一是考虑火力单元的更多属性类型,构建信息更加丰富的知识图谱进行预测;二是结合火力单元的实时动态信息进行预测。
[1]
赵福均, 周志杰, 胡昌华, 等. 基于置信规则库和证据推理的空中目标意图识别方法[J]. 电光与控制, 2017, 24(8): 15-19.

[2]
Jiang W, Han D, Fan X, et al. Research on Threat Assessment Based on Dempster-Shafer Evidence Theory[J]. Lecture Notes in Electrical Engineering, 2012(113): 975-984.

[3]
李香亭. 态势估计中目标意图识别的研究与实现[D]. 太原: 中北大学, 2012.

[4]
Jin Q, Gou X, Jin W, et al. Intention Recognition of Aerial Targets Based on Bayesian Optimization Algorithm[C]// 2017 2nd IEEE International Conference on Intelligent Transportation Engineering, Singapore, 2017: 356-359.

[5]
周旺旺, 姚佩阳, 张杰勇, 等. 基于深度神经网络的空中目标作战意图识别[J]. 航空学报, 2018, 39(11): 200-208.

[6]
Ahmed A A, Mohammed F M. SAIRF: A Similarity Approach for Attack Intention Recognition Using Fuzzy Min-Max Neural Network[J]. Journal of Computational Science, 2018(25): 467-473.

[7]
郑书奎, 吴琳, 贺筱媛. 基于深度学习的兵棋演习数据特征提取方法研究[J]. 指挥与控制学报, 2016, 2(3): 194-201.

[8]
邢思远, 倪晚成, 张海东, 等. 基于兵棋复盘数据的武器效用挖掘[J]. 指挥与控制学报, 2020, 6(2): 132-140.

[9]
刘满, 张宏军, 郝文宁, 等. 战术级兵棋实体作战行动智能预测方法[J]. 控制与决策, 2020, 35(12): 2977-2985.

[10]
胡晓峰, 齐大伟. 智能化兵棋系统: 下一代需要改变的是什么[J]. 系统仿真学报, 2021, 33(9): 1997-2009.

DOI

[11]
贺筱媛, 郭圣明, 吴琳, 等. 面向智能化兵棋的认知行为建模方法研究[J]. 系统仿真学报, 2021, 33(9): 2037-2047.

DOI

[12]
田玲, 张瑾川, 张晋豪, 等. 知识图谱综述:表示、构建、推理与知识超图理论[J]. 计算机应用, 2021, 41(8): 2161-2186.

DOI

[13]
PALUMBO E, RIZZO G, TRONCY R.entity2rec: Learning User-item Relatedness from Knowledge Graphs for Top-N item Recommendation[C]// Proceedings of the 11th ACM Conference on Recommender Systems, Como, Italy, 2017: 32-36.

[14]
GROVER A, LESKOVEC J.node2vec: Scalable Feature Learning for Networks[C]// Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, USA, 2016: 855-864.

[15]
邱锡鹏. 神经网络与深度学习[M]. 北京: 机械工业出版社, 2020.

[16]
Chung J, Gulcehre C, Cho K, et al. Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling[EB/OL]. arXiv:1412:3555, 2014.

[17]
Jing Li, Kan Jin, Dalin Zhou, et al. Attention Mechanism-Based CNN for Facial Expression Recognition[J]. Neuro Computing, 2020(411): 340-350.

[18]
Tan Y K, XU Xingxing, LIU Yong. Improved Recurrent Neural Networks for Session-based Recommendations[EB/OL]. [2018-10-15]https://arxiv.org/abs/1606.081172016.

Outlines

/