中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
仿真评估

基于潜在结果框架的作战能力测算方法

  • 林晗 1 ,
  • 耿梦影 2 ,
  • 迟晨阳 1 ,
  • 卜先锦 1,
展开
  • 1 军事科学院, 北京 100091
  • 2 国防科技大学, 湖南 长沙 410073
† 卜先锦(1964—),男,博士,研究员,博士生导师。

林晗(1998—),男,博士研究生,研究方向为军事因果统计推断。

Copy editor: 胡前进

收稿日期: 2025-05-07

  修回日期: 2025-05-28

  网络出版日期: 2025-11-22

A combat capability measurement method based on the potential outcome framework

  • LIN Han 1 ,
  • GENG Mengying 2 ,
  • CHI Chenyang 1 ,
  • BU Xianjin 1,
Expand
  • 1 Academy of Military Science, Beijing 100091, China
  • 2 National University of Defense Technology, Changsha 410073, China

Received date: 2025-05-07

  Revised date: 2025-05-28

  Online published: 2025-11-22

摘要

针对复杂军事场景下作战能力量化的难题,提出一种基于潜在结果框架的能力测算方法,以实现对抽象作战能力的量化测算。首先,将待评估对象定义为干预变量,并选取能直观反映作战效果的指标作为可观测结果变量;其次,构建了包含干预、作战能力和作战效能的因果图,明确建立了抽象作战能力与可测量效能指标间的因果路径;最后,进行因果效应推断和统计显著性检验,将作战能力测算问题转化为效能指标的函数。案例分析表明,所提出的方法以效能指标测算为手段,可实现对作战能力的间接测算,为破解作战能力的量化难题提供了有益参考。

本文引用格式

林晗 , 耿梦影 , 迟晨阳 , 卜先锦 . 基于潜在结果框架的作战能力测算方法[J]. 指挥控制与仿真, 2025 , 47(6) : 110 -115 . DOI: 10.3969/j.issn.1673-3819.2025.06.015

Abstract

Addressing the challenge of quantifying combat capabilities in complex military scenarios, this study proposes a novel capability measurement method based on the potential outcomes framework. This approach first define the object to be evaluated as an intervention variable and selects observable metrics that directly reflect operational effectiveness as outcome variables. Next, a causal graph is constructed, encompassing the intervention, combat capability, and operational effectiveness, thereby explicitly establishing the causal pathways between abstract combat capabilities and measurable effectiveness indicators. Finally, through causal effect inference and statistical significance testing, we transform the problem of measuring combat capability into a function of effectiveness indicators. Case analysis demonstrates that the proposed method, by utilizing effectiveness indicators as a measurement tool, can achieve indirect quantification of combat capabilities, offering a valuable reference for solving the quantification problem of combat capabilities.

在现代军事评估领域,准确测算作战能力是制定行动方案、优化资源配置和评估行动效果的关键环节。作战能力测算的准确直接影响资源配置合理性和行动方案的有效性。随着军事技术的飞速发展和战争形态的持续演变,陆海空天电网等作战要素之间的相互作用和影响日益复杂。在此背景下,如何科学、准确地测算作战能力成为军事评估研究长期探索的问题。
在传统战术行动能力评估视角下,指标赋权与聚合计算是评估过程中的关键环节[1],当前研究更倾向于结合主客观赋权法的组合赋权法[2],旨在通过整合两者的优势,为多指标的综合加权提供了创新路径。然而,在面对具体的战术场景时,这些传统方法逐渐暴露出其不足:一是作战能力测算往往需要解决能力指标的聚合计算方法,大多基于经验和假设,难以解释为何某些指标权重较高,某些较低,使得评估结果的可解释性不足;二是无法清晰地阐述具体作战单元或装备与行动效果之间的内在关系,难以从因果视角解释为何在特定战术行动中某些装备或战术运用方式更为有效;三是具体的战术决策场景对作战能力的动态评估提出了很高的要求,若能在评估过程中避免指标权重反复调整,将更有利于提升评估的时效性,发挥在复杂作战场景下的决策支撑作用。
潜在结果框架作为因果推断领域的重要理论框架,以反事实推理为核心,通过构建潜在结果框架,能够有效地推断因素间的因果效应。该框架为解决军事场景下作战能力测算问题提供了与传统多指标综合评价方法截然不同的路径。

1 理论基础

1.1 潜在结果框架基本概念

潜在结果框架(Potential Outcome Framework,POF),也被称为鲁宾因果模型,是由美国统计学家Donald B. Rubin于 20 世纪 70 年代提出的一种用于因果推断的重要理论框架,旨在解决如何从数据中准确推断因果关系的问题,在随机控制试验(RCT)和观测数据中均可运用[3]
潜在结果框架的核心概念是个体在特定干预下可能产生的结果。由于个体在同一时间只能接受一种干预,实际观测结果为事实结果,未观测结果为反事实结果。例如,对于一次作战行动而言,若将是否部署某型武器作为干预变量,则该行动中部署或不部署该型武器两种情况仅能实现其一,其对应的结果为实际结果;而因另一情况未发生而无法观测的结果即为反事实结果。随着对该框架研究和应用的不断深入和拓展,潜在结果框架已在经济学、社会学、医学等多个学科领域得到广泛应用,并成为因果推断的核心方法之一。

1.2 潜在结果框架要素构成

(1)潜在结果:对于个体i,在干预D(D=1表示接受干预,D=0表示未接受干预)下的潜在结果分别记为Yi(1)和Yi(0),其中,Yi(1)表示个体i接受干预后的潜在结果,Yi(0)表示个体i未接受干预的潜在结果。
(2)协变量与混淆变量:协变量X是除了干预变量和结果变量之外的任何其他变量,它可能与干预D或结果变量Y相关,或者与两者都相关。其中,混淆变量是特指那些既与干预变量相关,又与结果变量相关的协变量。如果不对混淆变量进行控制,就无法消除干预变量与结果变量之间的虚假关联。通过控制协变量,能够有效减少其中混淆变量导致的偏差,更准确地评估干预对结果变量的因果效应。
(3)个体因果效应(Individual Treatment Effect,ITE):ITE量化了干预对个体i的影响,定义式为ITEi=Yi(1)-Yi(0)。然而,因为反事实结果无法直接观测,Yi(1)和Yi(0)中必然有一个是反事实结果,所以ITE无法直接计算。
(4)平均因果效应:为了从总体上评估干预的效果,通常关注平均因果效应(Average Treatment Effect,ATE),定义式为τATE=E[Yi(1)-Yi(0)]。此外,还有干预组平均因果效应(Average Treatment Effect on the Treated,ATT),τATT=E[Y(1)-Y(0)|D=1],表示接受干预的个体的平均因果效应;以及控制组平均因果效应(Average Treatment Effect on the Untreated,ATU),τATU=E[Y(1)-Y(0)|D=0],表示未接受干预的个体的平均因果效应。

1.3 潜在结果框架基本假设

潜在结果框架的应用须建立在两个关键假设之上:一是稳定单元干预值假设(Stable Unit Treatment Value Assumption,SUTVA),二是可忽略性假设。具体而言:
(1)SUTVA:任意单元的潜在结果不因其他单元所接受的干预而改变,即个体之间的干预效果是相互独立的,不存在相互影响效应。例如,在多次作战实验中,单次实验中某型装备的运用效果不受到其他实验是否运用该型装备的影响。
(2)可忽略性假设:又称无混淆假设,该假设要求在给定协变量X的条件下,干预的分配D独立于潜在结果,即Y(1),Y(0)⊥⊥D|X。这意味着在控制了协变量X后,干预的分配是随机的,不存在同时影响干预分配和潜在结果的变量,即消除了混淆变量造成的偏差。例如,在研究某型装备对行动的影响时,若干预组和控制组在其他属性的分布上是相似的,那么该型装备的分配就可以被认为是随机的,此时就满足可忽略性假设。

2 基于潜在结果框架的能力测算模型构建

2.1 模型构建思路

潜在结果框架的核心在于通过反事实推理,评估特定干预措施对结果变量产生的因果效应。本模型尝试根据结果变量的情况来间接推断作战能力,主要步骤包括定义干预变量、结果变量、分析因果链的合理性、度量因果效应和推断作战能力。
(1)定义干预变量D。干预变量D是指施加于实验的可操作性策略或资源调整,代表战术或装备的运用,例如部署某种装备(D=1)或不部署(D=0)。
(2)定义结果变量Y。由于作战能力通常难以直接观测,从作战过程或结果中选取一个具有代表性的、可用于间接衡量作战能力变化的可观测指标作为结果变量Y。例如选取敌我战损比、任务完成时效或其他效能指标作为结果变量。
(3)分析因果链的合理性。本模型要求干预变量影响结果变量必须通过作战能力中介,即构成因果链“干预变量D→作战能力M→…→结果变量Y”。
(4)度量因果效应。通过观测数据(历史数据)或推演数据(仿真数据),估计干预变量对结果变量的平均因果效应,其计算方法通常是比较干预组(D=1)与控制组(D=0)在结果变量上的均值差异。根据具体的应用场景和分析目标,也可以计算ATT或ATU。
(5)基于结果推断作战能力。由于干预变量对结果变量的因果效应完全是由作战能力中介,若干预对结果产生了显著影响,必然是由于作战能力改变而产生的结果,因此可以通过结果变量的变化情况推断作战能力的水平。

2.2 模型应用假设

本研究提出的能力测算模型,符合Ghassami等人提出的隐藏前门模型[4],该模型包含干预变量D、结果变量Y、协变量X、中介变量M。该模型及其军事内涵如图1所示。为了将该模型运用于能力测算,除了满足潜在结果框架的基本假设外,还需要满足完全中介效应假设和单调性假设,才能够从因果关系中推导出可靠的相关关系。
图1 隐藏前门模型(上)及军事内涵(下)

Fig.1 Hidden Front Door Model (Top) and Military Implications (Bottom)

(1)完全中介效应假设:国内学者普遍认为作战能力是相对静态固有属性,而作战效能则与实际运用密切相关[5]。基于此认知,本研究要求干预变量D对结果变量Y的因果路径必须完全由作战能力M中介,亦可表示为满足Y(D=d)=Y(M(D=d))。表明干预变量D对结果变量Y只存在间接因果效应,而不存在直接因果效应。通俗地讲,对于部队装备属性、兵力结构等各方面的干预,其对作战效能的影响必须通过作战能力来传递。
(2)单调不减性假设:现有研究指出作战效能的增强、减弱能代表整体能力的演进方向[6]。根据这一论断,假设作战能力M对结果变量Y具有非负效应,满足sign Y M≥0,其中,sign函数是符号函数。该假设意味着,对于部队装备属性、兵力结构等各方面的干预调整,如果能够提升部队的作战能力,则不会对部队的作战效能产生消极影响;反之亦然,如果降低了部队的作战能力,则不应对部队的作战效能产生积极影响。该假设是否成立依赖于评估场景,限定了本研究所提方法主要适用于战术层面的分析,在该层面上,作战能力的增强通常与作战效能的提升呈正相关。

2.3 模型构建及应用

能力测算模型主要应用于以下两类评估场景:一是在仿真推演[7]中进行能力测算[8],通过仿真推演系统模拟特定作战环境和对抗场景,评估不同武器装备组合的协同效果,分析资源配置和战术选择对行动结果的影响;二是在实际作战行动数据中进行能力测算,基于实时或历史数据进行动态能力评估,掌握部队作战能力底数。
仿真推演场景下,可以开展RCT,即协变量X与干预变量D的分配相互独立,这意味着干预组和控制组在协变量分布上是相似的,其军事意义为,当探究对部队某方面属性的干预产生的影响时,其他属性在干预组和控制组中应保持相似。例如探究侦察范围的提升对部队作战能力的具体影响时,应该控制诸如更新频率、雷达测向精度等其他属性保持一致。这种情况下,式(1)作为ATE的无偏估计量。
τ ^ A T E=E[Y|D=1]-E[Y|D=0]
在观测数据中进行能力测算时,由于数据来源于历史观测,无法像RCT那样人为控制干预变量D。因此,必须考虑协变量X的影响。为了减少由协变量X造成的偏差,应采用倾向得分匹配算法。倾向得分匹配算法能在协变量上模拟随机分配,使得干预组和控制组在协变量上具有可比性,从而更准确地估计因果效应。该过程通过式(2)计算个体接受干预的概率,并以式(3)作为ATE的无偏估计量。
e(Xi)=P(Di=1|Xi)
τ ^ A T E - I P W= 1 N i = 1 N D i Y i e ( X i ) - ( 1 - D i ) Y i 1 - e ( X i )
如果“干预变量D→结果变量Y”的因果效应通过显著性分析,则为“干预变量D→作战能力M”的因果效应以及作战能力M和结果变量Y的相关性提供了支持。此时,作战能力M可以通过式(4)表示,其中f(·)为非减函数,ε为随机误差项。
M=f(Y)+ε
能力测算模型构建及应用过程如图2所示。
图2 能力测算模型构建及应用

Fig.2 Construction and Application of the Capability Measurement Model

与基于潜在结果框架的能力测算模型相比,传统的能力评估方法侧重于构建基于专家知识的多指标综合评价体系,并通过指标计算和赋权[9]来评估作战能力,本质是对相关性的经验分析,缺乏对作战能力与结果变量之间因果链的显式建模。由于战场环境和作战场景的动态变化,指标权重往往需要根据具体的场景特征进行反复调整,这不仅对专家的领域知识提出了极高的要求,也难以适应快速变化和需要进行大量重复评估的场景。本文提出的能力测算模型,可通过RCT实验或倾向得分匹配,有效进行因果效应推断,并实现对作战能力更准确的评估。

3 联合监视侦察能力评估案例分析

为了说明模型的实际运用效果,研究人员选取一个基于事件驱动的多Agent仿真系统构造不同空域监视侦察能力下的联合部队制空作战情形[10],该仿真平台能够模拟三维空间内的空域态势和作战单元的动态行为,集成了一系列先进的深度强化学习算法,确保各战术单元能依据实时战场信息动态规划和调整行动策略。战术级通信和作战协同通过平台内建的通信模型实现,真实地反映现实作战场景中信息传递和协同配合的过程。
为构建多样化的空域监视侦察体系,选取了地面雷达监视、空中预警机侦察、目标区域南侧水面舰艇监视和北侧水面舰艇监视这4种关键侦察力量,其中,地面雷达的运用被选作干预变量。为了运用潜在结果模型,需要大量在不同初始场景下、运用不同监视侦察体系执行任务的数据。本研究通过RCT获取大量数据,以支持ATE的估算。

3.1 实验设计

本实验聚焦制空作战场景下监视侦察能力发挥作用,并采用RCT实验对其进行量化测算。选取了地面雷达的运用作为干预变量,构建包含监视侦察能力(MS)、火力打击能力(MH)和作战效能(Y)的场景模型,如图3所示。干预变量Di对于潜变量 M S i具有直接的因果效应,即是否运用地面雷达直接影响我方的空域监视侦察能力;潜变量 M S i对潜变量 M H i具有直接因果关系,表示我方的空域监视侦察能力直接影响我方火力打击能力。潜变量 M S i和潜变量 M H i对结果变量Yi具有直接因果关系,表示我方空域监视侦察能力和我方火力打击能力共同影响作战效果。
图3 联合制空作战因果模型

Fig.3 Causal Model of Joint Air Superiority Operations

RCT过程包括场景生成、变量定义、干预分配、设计因果图、分组实验和数据采集,其过程如图4所示。
图4 RCT实验流程

Fig.4 Experimental process of RCT

(1)场景生成。本研究随机生成200个标准化场景Sceni(i=1,2,…,200),采用随机过程生成场景特征参数,并依据场景参数生成作战想定。
(2)变量定义。对于每个场景Sceni定义潜变量 M S i表示该场景中我方空域监测侦察能力,定义潜变量 M H i表示我方火力打击能力,这两个变量是无法直接测算的指标。参考谌东彤[11]等人基于仿真推演开展的作战效能评估,本实验选取战损比这一可测量指标作为结果变量Yi
(3)干预分配。对于每个场景Sceni,随机干预变量Di的取值,将场景划分进干预组(Di=1)和控制组(Di=0)。干预组中的各场景地面雷达处于开启状态,而控制组中地面雷达则处于关闭状态。
(4)分组实验和数据采集。采用仿真平台对每个场景进行了独立的仿真推演,记录相关数据构建为仿真数据集,以作为后续计算结果变量Yi和估算因果效应的依据。

3.2 实验结果

在实验中,由RCT随机分配形成的干预组包含104个场景,控制组包含96个场景,干预组和控制组的样本数量接近,协变量分布比较均衡。分析过程包含计算ATE、显著性检验和能力指标测算:
(1)计算ATE:由于协变量在干预组和控制组中分布均衡,说明已经控制了混淆变量,可以直接运用式(1)对ATE进行估计,得到ATE为0.18。
Y - DE[Y|D=1]=1.02, Y - CE[Y|D=0]=0.84
τ ^ A T E= Y - D- Y - C=0.18
(2)显著性检验:在样本容量较大的场景下(N>30),运用Z检验。建立原假设H0和备择假设H1
原假设H0: Y - D= Y - C
备择假设H1: Y - D> Y - C
依据式(5)计算Z统计量的值为2.795,该值在1%水平下显著,说明根据结果有充分的理由拒绝原假设,即说明干预组的作战效能显著高于控制组。
Z= Y - D - Y - C S D 2 N D + S C 2 N C
(3)能力指标测算:通过显著性检验,证实了干预变量Di对结果变量Yi存在显著因果效应。控制组中不运用地面监视雷达,监视侦察能力MS=f(0.84)+ε;处理组中运用了地面监视雷达,监视侦察能力MS=f(1.02)+ε。由于Di M S iYiDi M S i M H iYi两条因果路径都由Msi中介,这意味着, τ ^ A T E不仅是预变量Di对结果变量Yi的影响,也代表着干预变量Di对潜变量 M S i的有效贡献,说明运用地面雷达能给监视侦察能力带来21.4%的提升。

3.3 实验结论

本研究实现了对抽象的监视侦察能力的有效测算。通过采用RCT方案,依据200个场景的仿真结果,达到了监视侦察能力可量化、可对比的研究目的,为装备部署运用的方案评估提供了数据支撑。尽管在案例分析中以地面雷达的运用作为示例,但本方法不仅适用于评估单一类型装备平台对作战能力的影响,更可灵活应用于复杂的装备体系分析,完全取决于干预变量的设置。与传统的综合评价方法相比,规避了指标权重难确定和可解释性不足的问题,推动军事决策从“经验主导”向“数据驱动”转型。

4 结束语

为解决联合作战能力评估中指标聚合计算带来的问题,克服传统评估方法中经验主导的局限性,本文提出了一种基于潜在结果框架的能力测算方法。该方法建立了抽象作战能力与可测量的作战效能指标之间的因果路径,通过ATE及其显著性进行了分析。该方法不仅适用于仿真推演场景下的能力评估,同样也适用于实装试验数据和实兵演训数据等观测数据场景。在观测数据场景下,实现ATE的无偏估计可作为未来研究的重要方向,以进一步拓展本文所提方法的适用范围。
[1]
刘帅, 王瑞, 张宏江, 等. 基于VBS3的装备体系作战仿真评估系统设计[J]. 计算机仿真, 2021, 38(2): 13-17, 421.

LIU S, WANG R, ZHANG H J, et al. Design of simulation and evaluation system for operational test of equipment system of systems based on VBS3[J]. Computer Simulation, 2021, 38(2): 13-17, 421.

[2]
李皓, 孟英谦, 杨清清, 等. 智能化背景下基于双因子赋权和证据推理的作战效能评估方法[J]. 火力与指挥控制, 2024, 49(12): 158-166.

LI H, MENG Y Q, YANG Q Q, et al. The a combat effectiveness evaluation method based on two-factor weighting and evidence reasoning in the context of intelligent warfare[J]. Fire Control & Command Control, 2024, 49(12): 158-166.

[3]
RUBIN D B. Estimating causal effects of treatments in randomized and nonrandomized studies[J]. Journal of Educational Psychology, 1974, 66(5): 688-701.

DOI

[4]
GHASSAMI A, YANG A L, SHPITSER I, et al. Causal inference with hidden mediators[J]. Biometrika, 2025, 112(1): 37-38.

[5]
杜红梅, 柯宏发. 装备作战能力与作战效能之内涵分析[J]. 兵工自动化, 2015, 34(4): 23-27.

DU H M, KE H F. Connotation analysis of equipment combat capability and equipment combat efficiency[J]. Ordnance Industry Automation, 2015, 34(4): 23-27.

[6]
刘兆鹏, 罗睿, 王强, 等. 基于功能和效应的作战能力指标体系设计[J]. 火力与指挥控制, 2020, 45(6): 24-29.

LIU Z P, LUO R, WANG Q, et al. Design of combat capacity index system based on measures from performance and effective perspective[J]. Fire Control & Command Control, 2020, 45(6): 24-29.

[7]
李志强, 刘经德, 殷来祥, 等. 基于兵棋推演的联合侦察预警能力评估[J]. 指挥控制与仿真, 2023, 45(3): 71-77.

DOI

LI Z Q, LIU J D, YIN L X, et al. Capacity assessment of joint reconnaissance & warning system based on wargame[J]. Command Control & Simulation, 2023, 45(3): 71-77.

[8]
孙明, 黄俊卿, 马亚龙. 基于对抗仿真数据的作战效能评估方法论研究[J]. 系统仿真学报, 2013, 25(S1): 366-371.

SUN M, HUANG J Q, MA Y L. Research on methodology of operational efficiency evaluation based on combat simulation data[J]. Journal of System Simulation, 2013, 25(S1): 366-371.

[9]
马万斌, 杨清清, 郑桂妹. 联合防空反导体系反无人机作战能力评估问题研究[J]. 空军工程大学学报, 2025, 26(1): 86-94.

MA W B, YANG Q Q, ZHENG G M. A study of counter-drone combat capability evaluation in joint air and missile defense system[J]. Journal of Air Force Engineering University, 2025, 26(1): 86-94.

[10]
张大曦, 杨雪榕, 张占月. 基于Agent的反导体系效能评估方法研究[J]. 火力与指挥控制, 2018, 43(2): 86-90.

ZHANG D X, YANG X R, ZHANG Z Y. Modeling and simulation research of ballistic missile defense system based on agent[J]. Fire Control & Command Control, 2018, 43(2): 86-90.

[11]
谌东彤, 谭亚新, 亓鹏程. 基于仿真结果的装备作战效能评估方法研究[C]// 第三十四届中国仿真大会暨第二十一届亚洲仿真会议论文集,中国湖南长沙, 2022.

CHEND T, TANY X, QIP C. Research on the evaluation method of equipment combat effectiveness based on simulation results[C]// Proceedings of the 34th China Simulation Conference and the 21st Asian Simulation Conference, Changsha, Hunan, China, 2022.

文章导航

/