中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Modeling & Simulation

Design and implementation of a wargaming system with incomplete observations

  • XIE Zhiqiang 1 ,
  • QI Xiuli 1, ,
  • YU Xiaohan 1 ,
  • YAO Changhua 2
Expand
  • 1 Army Engineering University, Nanjing 210007, China
  • 2 Nanjing University of Information Science and Technology, Nanjing 210044, China

Received date: 2025-01-17

  Revised date: 2025-03-11

  Online published: 2026-03-25

Abstract

Modern computer wargames have been widely valued and applied. However, the ideal assumption in wargame systems that the observation among friendly forces is completely shared is far from the reality, which limits the simulation of many real-world situations. Therefore, in order to solve the above problems, this paper proposed a wargaming system framework with incomplete observation, where seats are the participants, and the wargaming simulation process is sorted out, including the model library, simulation engine, observations distribution, and front-end deduction. Then, referring to and comparing with mature wargame systems, we elaborately designs the elements of the wargame system related to the incomplete observation, such as seat model, communicator operator, intelligence model, communication action and adjudication, as well as the generation process of the incomplete observation. Finally, a red-blue confrontation scenario with three seats versus four seats was designed to verify the feasibility and effectiveness of the wargaming system described in this paper.

Cite this article

XIE Zhiqiang , QI Xiuli , YU Xiaohan , YAO Changhua . Design and implementation of a wargaming system with incomplete observations[J]. Command Control and Simulation, 2026 , 48(2) : 106 -113 . DOI: 10.3969/j.issn.1673-3819.2026.02.015

兵棋推演起源于十九世纪初普鲁士人发明的手工兵棋,在该系统上,整个战场的信息对各对阵方而言是完全可见的,即明棋[1-2];随着信息技术的不断发展,具有推演连续性、响应快速性和模型精准性等特点的计算机兵棋替代了手工兵棋,这也为“战争迷雾”的实现提供了技术支持[3-4]。然而,现代计算机兵棋在同阵营内部情报共享方面存在明显不足,其通常假定所有作战单元共享同一态势信息,与实际战争中需要基于通信才能分享情报的情形不符[4-5]。这种理想化的情报共享假设可能导致基于此类系统训练的指挥员在面对战场信息受限的复杂环境时,难以有效适应和应对[6-7]
因此,本文针对现有战术级兵棋系统存在的己方态势信息共享问题,设计了符合战场实际的不完全态势兵棋推演系统框架。首先,结合推演实际引入“席位”作为不完全态势的最小单元并设计了“席位”模型来描述不完全态势的具体内容;其次,设计了通信员算子模型和情报模型来描述通信的收发主体和内容。通过制定算子的通信动作及相应的裁决规则,来模拟战场通信行为;最后,设计实验验证本系统的合理性,为推动兵棋的发展提供新的研究路径。

1 问题描述

兵棋推演系统应真实反映战场信息的不确定性。在战术层级推演系统中,不完全态势信息包含敌方和己方两种不完全态势信息。对于敌方不完全态势信息,又称为“战争迷雾”,即对敌方状态需通过“观察”才能部分可见。如图1(a)所示,红方1号算子能观察到蓝方1号和2号算子,而蓝方3号和4号算子不在其观察范围内,因此不可见,同时红方2、3和4号算子直接共享红方1号算子的观察态势。对于己方不完全态势信息,如图1(b)所示,蓝方1号算子只在红方1号算子观察范围内,红方2号算子根据红方1号算子分享的态势也掌握了蓝方1号算子的信息,然而红方3号算子由于没有得到态势分享,所以并不知道蓝方1号算子的信息,己方算子之间的态势信息是有差异的,与真实情况相同。
图1 不完全态势信息

Fig.1 The information of incomplete observation

虽然计算机兵棋已有效解决了敌方不完全态势信息的问题,但对于己方不完全态势信息的研究仍属空白[8-10]。引入己方态势不完全的兵棋推演不仅更加符合实际,能够训练指挥员应对不完全态势信息的能力[11-12],同时当前计算机技术足以支持实现不完全的推演方式,因此有必要研究如何模拟战场通信方式实现己方态势不完全。
要实现己方不完全态势信息,一种方式可基于单个算子进行设计,即各算子之间信息不直接共享,需要借助信息共享的通信机制,这种方式与真实情况相吻合,但是将导致一场包含二十个算子的推演需要20名玩家来控制,增加了推演成本。所以,本文采用一种折中的方式,多个算子构成一个“席位”,“席位”由一名推演人员控制,“席位”内部算子的态势信息完全共享,“席位”之间的态势则需要通过“通信”的方式来实现态势共享,“席位”的概念并非首次被提出,在中国指挥与控制学会发布的“灵弈”联合作战智能推演平台中也有“席位”的概念,但该设计是为了多个推演人员共同参与推演而设计的,并没有考虑到己方不完全态势信息。

2 系统框架

当前计算机兵棋推演系统通常采用“模型库—推演引擎—推演前端”的设计模式[13]。“模型库”是系统运行的底层,存储算子、武器、裁决和地图等模型,供引擎运行时调用;“推演引擎”是系统的核心部分,负责推动系统运行、更新态势和处理事件等;“推演前端”,则是用来显示推演过程并供推演人员控制算子使用。
针对战术级兵棋推演系统,设计如图2系统框架,整体由模型库、推演引擎、不完全态势分发模块和推演前端四部分组成。模型库中存储算子、地图、武器、动作、裁决、想定、目标和分发等多个模型,供推演引擎运行时调用。推演引擎严格按照规则驱动,其中裁决模块使用裁决规则和模型库中算子、地图、武器、动作、裁决和目标等多个模型来完成对推演前端产生的“动作”的裁决,裁决通过后,随后将对模型库进行更新并汇总态势。不完全态势分发模块,用于接收引擎汇总的态势信息,并根据对应的席位调用模型库中的分发模型分发不完全态势信息。推演前端的推演人员使用命令控制一个席位内的多个算子,实时接收来自不完全态势分发模块的不完全态势信息,并根据态势操控算子产生动作。例如当席位内的算子观察到敌方信息或己方信息发生变化时,则可主动控制席位内的通信算子发出“通信动作”到推演引擎。系统对抗产生的数据都需保存到数据库中。
图2 不完全态势兵棋推演系统框架

Fig.2 Framework of the wargaming system with incomplete observations

本节描述了不完全态势兵棋推演系统的基本框架,包括模型库、推演引擎、不完全态势分发模块和推演前端4个核心部分。在接下来的系统设计部分,本文将详细讨论框架中各模块与不完全态势信息相关的具体实现方法,以构建出不完全态势兵棋推演系统的核心功能。

3 系统设计

传统的完全态势兵棋是建立在完美的态势共享的假设之上的,可以认为己方所有算子之间都存在实时连接、大带宽、无延迟的理想通信链路,从而保证己方所有算子的态势相同。因此研究人员设计不完全态势兵棋推演系统的关键在于通信链路的设计,本文以通信行为及相关要素的设计作为切入点,构建出兵棋系统的不完全态势。图3展示了不完全态势兵棋推演系统中的通信过程。从图3中可以看到,席位间想要分享态势,需要通过通信动作来推动,同时对通信动作实施通信裁决以模拟战场环境中的通信行为。裁决通过后,席位根据裁决结果延迟分享态势。每一次席位间的态势分享或自身观察都是对不完全态势信息的态势更新,更新后的态势信息再经过分发操作供相应的推演人员使用。该过程涉及了席位、不完全态势、通信节点算子、通信动作与裁决等要素。
图3 不完全态势兵棋推演系统的通信过程

Fig.3 The communication process of the wargaming system with incomplete observations

3.1 席位模型与不完全态势

每个席位作为独立的整体,拥有属于自己的不完全态势。席位在某一时刻包含的态势信息有通信节点算子信息、席位内普通算子信息、夺控点信息、裁决信息和当前得分情况5个部分。通信节点算子负责与其他席位分享态势;夺控点信息描述当前时刻夺控点的状态;裁决信息描述了动作的裁决内容;当前得分情况用于描述动态分数。因此席位模型如公式(1)所示:
Seat=<N,o',O,T,S,J,t>
N表示为席位名称;o'是该席位的通信节点算子;O={Operatori|i=1,…,m}为该席位普通算子集合;T={Targeti|i=1,…,n}为该席位掌握的夺控点集合;S={Scorei|i=1,…,k}为该席位得分情况;J={Judgei|i=1,…,l}为该席位的裁决情况;t为当前时间。普通算子O、夺控点T、得分情况S和时间t的设计与“庙算”陆战对抗兵棋平台中保持一致;裁决信息J中新增了通信动作的裁决。
席位模型确定了席位的态势样式,基于席位模型的态势在本文中就是不完全态势。“庙算”兵棋各方的态势中包含了己方所有算子以及观察到的敌方算子,而本文的席位模型中把观察信息(实际上还有其他席位分享信息)放到了通信节点算子的情报中。

3.2 通信员算子与情报模型

引入席位并限制席位之间态势直接共享后,构建出了己方态势不完全的状态。席位之间虽然不直接共享态势,但不能不分享态势,这需要每个席位中有可以进行通信的算子,称为通信节点算子。通信节点算子的模型如下:
o'=<D,A,E,I,tc>
其中,D是算子的唯一标识;A={Attributei|i=1,…,s}为算子属性集合;E={Equipmenti|i=1,…,t}为装备集合,描述该算子拥有的武器;I={Intelligencei|i=1,…,p}为该席位掌握的情报。tc用于记录一次通信之后的剩余冷却时间。
通信的具体内容由推演人员自主选择,而通信情报类型应该有所规范。在本系统中定义了包含战场观察情报、指令情报、自身状况情报在内的三种情报,每种情报信息共享的内容都不相同,用于模拟战场中多种作战任务和作战情况。具体各情报类型包含的内容如表1所示。
表1 情报模型

Tab.1 Intelligence model

情报类型 属性 数据类型 含义
观察情报 CurHex 整数 敌方位置
Type 字符串 敌方类型
State 字符串 敌方状态
Direction 字符串 方向信息
Terrain 字符串 地形信息
Time 浮点 时间信息
自身状况情报 Troop 字典 人员信息
Equipment 字典 武器信息
Materiel 字典 物资信息
Terrain 字符串 地形信息
Time 浮点 时间信息
ID 整数 指令类型
指令情报 Message 字典 指令内容
Time 浮点 时间信息
指令情报中ID的取值范围为0~6,分别表示进攻、防守、撤退、伏击、侦察、追击、阻击7种指令。Message记录不同指令的具体内容。

3.3 通信动作与裁决

3.3.1 通信动作

定义了通信员算子后,态势的发送者和接收者随之确定,但是通信节点算子何时发送以及用什么方式发送还需进一步确定。时间上应由通信算子在通信冷却时间过后随时可以发送,而如何发送则需要设计相应的动作来触发。表2是通信动作模型,模型仅保留描述通信动作必要的属性。通信动作发生在2个席位的通信节点算子之间,当某个席位的通信算子损毁时,该席位将无法获得来自其他席位的分享态势。通信动作模型中最重要的属性是Intelligences属性,情报集合,保存通信的具体内容。
表2 通信动作模型

Tab.2 Communication action model

属性 数据类型 含义
ActionType 字符串 动作类型
SenderSeat 字符串 发送端席位
ReceiverSeat 字符串 接收端席位
Intelligences 字典 情报信息

3.3.2 通信裁决

裁决是系统重要的组成部分,裁决设计的质量优劣直接影响系统模拟的真实性[10]。通信动作的裁决过程是:①判断通信双方是否满足通信条件;②确定通信双方是否在通信范围内;③判定地形是否阻隔通信;④根据通信距离得出通信成功率;⑤根据通信内容的大小和通信距离来计算通信延迟,通信内容越多且距离越远,随机延迟范围则越大。
通信双方应满足如下通信条件:①通信只能在同一阵营之间进行,由席位的通信员算子发出由其他席位的通信节点算子接收,同一席位内的算子不需要通信,信息共享。②只有相互通信的算子处于都停止状态时才可以完成通信动作并且隐蔽状态下进行通信会暴露自身位置。③发出通信动作后,会进入10 s冷却时间,冷却时间内不能再次通信。冷却时间的引入用于模拟操作人员将通信内容录入系统并发送的延迟。④通信成功率受通信距离的影响,随着通信距离的增加,成功率会有所下降,最大通信距离为9格。
通信阻隔的判断是根据通信节点算子所在六角格的距离和地形高程计算出通信路径上所经各六角格的可通信高度,对比对应六角格的高程以确定是否阻隔通信,其示意图如图4所示。
图4 通信障碍判断示意图

Fig.4 Diagram of communication obstacle assessment

通信路径上任一六角格t的高程ht应不高于该格的最大可通信高度hmax,最大可通信高度的计算如下:
hmax= d ( a , t ) d ( a , t ) + d ( t , b )(hb-ha)+ha
其中,d(a,t)、d(t,b)分别表示六角格ab与通信路径上t格之间的距离,hahb分别表示六角格ab的高程,θ>0是高度修正值,用以模拟通信电波的绕射能力。

4 实验

4.1 实验想定

为了验证本文所提系统的有效性,本文基于“庙算”陆战对抗兵棋平台中的想定,结合不完全态势特点设计了实验想定,使用前端来呈现推演过程,并通过对比实验来验证。在初始想定中,红方拥有3个席位,1和3号席位分别位于坐标3 125(夺控点1)和4 827(夺控点2)处的两个夺控点附近,2号席位位于两个夺控点中间3 922附近;蓝方则拥有4个席位,位于坐标4 441、3 132、4 140和4 841附近,具体双方兵力部署情况见表3,其中加粗的为通信节点算子,均为班排级。1个席位由1名推演人员控制,红方的主要作战目标是守护夺控点并尽可能消灭蓝方兵力,蓝方主要作战目标是抢占夺控点并尽可能消灭红方兵力,总推演时长900 s。
表3 兵力部署情况

Tab.3 Troop deployment situation

席位 算子及位置
红方席位1 坦克100:3 025、步兵101:3 124、步兵战车102:3 225、炮兵103:3 116、无人机104:3 126
红方席位2 坦克200:3 922、无人战车202:4 022、坦克201:3 921、无人战车203:4 021
红方席位3 坦克300:4 927、步兵301:4 826、步兵战车302:4 728、炮兵303:4 819、无人战车304:4 828
蓝方席位1 坦克400:4 440、步兵战车401:4 441、无人战车402:4541
蓝方席位2 步兵500:3 132、步兵501:3 032、无人机502:3 033、无人机503:3 133、步兵504:3 232、步兵505:3 233
蓝方席位3 炮兵600:4 140、炮兵601:4 040
蓝方席位4 坦克700:4 840、步兵战车701:4 841、无人战车702:4 940

4.2 不完全态势与通信过程

在推演初始时刻时,各席位的观察态势如图5所示。
图5 初始时刻,不同席位视角

Fig.5 Views from different seats at the initial moment

图5(a)是导演视角,描绘了战场的初始态势;图5(b)是红方席位1视角,红方席位1可观测蓝方席位2的算子并能够与红方席位2进行通信;图5(c)是红方席位2视角,红方席位2具备与红方席位1和席位3进行通信的能力;图5(d)是红方席位3视角,红方席位3仅能够与红方席位2通信;图5(e)是蓝方1、3和4的视角,这3个席位共享相同的视角;图5(f)是蓝方席位2视角,能够看到红方席位1的100~102算子,对于红方席位1的103算子、红方其他席位和蓝方其他席位都不可知。在推演过程中,同一阵营中任意席位对于态势信息的获取不再自动共享,而是由自身观察和通信两种方式获得。例如图6所示的通信过程,图6(a)是2 s时红方席位2的视角,在该时刻,红方席位2对于蓝方算子信息是不可知,红方席位1将自身观察到的蓝方席位2位置信息通过通信方式分享给红方席位2;在图6(b)中到5 s时,红方席位2对于2 s时的蓝方席位2信息已可显示。
图6 通信过程

Fig.6 Communication process in the wargame system

4.3 推演对抗过程呈现

图7是101 s时刻导演视角的推演过程交战切片图,该时刻产生了4个通信动作。红方席位2在5 s首次观察到蓝方席位2的信息后,向夺控点1机动。此时,红方席位1向红方席位2发送指令(进攻)情报,经过系统裁决后,红方席位2成功收到情报,并开始向敌方目标(蓝方席位2)进攻。红方席位3在该时刻侦测到蓝方算子向夺控点2进攻信息,并同时向红方席位2发送该信息,因为红方席位2已经超出两者的最大通信范围,所以该通信失败。同时蓝方4号席位向蓝方1号席位发送指令(进攻)情报;前一秒蓝方1号席位向蓝方3号席位发送指令(进攻)情报,两者都通信成功。
图7 推演过程交战切片图

Fig.7 Slice of battle engagement during the wargaming process

图8是关键节点推演过程图,其中图8(a)是324 s时,蓝方1号和3号席位成功占领了夺控点2,并准备与蓝方2号席位进一步进攻夺控点1,而此时红方1号席位向2号席位发送指令(防守)情报,因为红方的主要作战任务是守护夺控点。图8(b)是推演的最终结果,蓝方成功占领夺控点1,此时棋盘中蓝方剩余作战单元为坦克700、坦克400、炮兵600和炮兵601 4个算子,红方剩余炮兵103一个作战单元。不难想象,如果这场推演是在传统的完全态势兵棋中,红方能第一时间发现蓝方的动向,及时调整策略,蓝方将无计可施。只有在本文的不完全态势兵棋中,蓝方才可能成功欺骗红方,利用少部分兵力牵制红方,集中兵力隐蔽夺取夺控点2。不完全态势兵棋更接近真实场景,也更有助于锻炼对抗双方的指挥能力。
图8 推演过程图

Fig.8 The picture of wargaming process

图9中展示了席位之间的通信频次的热力图。在红方阵营中,红方1号席位与红方3号席位由于通信距离的限制,两者的通信频次为0;而红方2号席位与红方1号席位之间由于处于协同作战状态,所以他们之间的通信频次远高于红方2号席位与红方3席位之间的通信频次。在蓝方阵营中,蓝方1号席位与4号席位由于从始至终都在协同作战,所以它们之间的通信频次最多;蓝方3号席位与1(4)号席位之间的通信数量也较多,3号席位担当辅助作战的作用;蓝方2号席位与1,3和4号席位之间的通信频次较少,在推演初期,由于通信距离的限制通信频次几乎为0,到进攻第二个夺控点时才开始通信,所以总体的通信频次较少。在不完全态势兵棋中,席位之间的通信频次反映出协同程度的深浅,研究人员引入不完全态势的兵棋推演系统将有助于开展兵棋智能体的协同智能相关研究。
图9 席位间通信数量热力图

Fig.9 Heatmap of communication counts between seats

5 结束语

本文从当前兵棋推演对抗系统存在的己方态势信息不完整问题出发,综合考虑战场实际、推演实际和当前兵棋推演系统设计理念,提出不完整态势兵棋推演系统框架。基于此框架,对不完整态势兵棋推演系统流程进行设计,并详述了战场通信相关的作战单元、动作和情报模型。最后,在本系统中构建信息受限的战场环境,设计包含多个席位的红蓝对抗场景,模拟指挥员在情报模糊、通信受阻等复杂条件下的决策过程,以提升参训人员对战场态势评估能力与不确定条件下快速应变能力,实验结果表明,该系统能够模拟不完全的态势场景,有效地解决己方态势信息不完整问题。研究人员下一步的研究方向将在不完整态势的基础上构建更加合理的通信网络架构,考虑环境影响,引入多种侦察装备和智能数据处理方法来进一步优化态势感知网络,使推演对抗更加贴合战场实际。
[1]
王桂起, 刘辉, 朱宁. 兵棋技术综述[J]. 兵工自动化, 2012, 31(8): 38-41, 45.

WANG G Q, LIU H, ZHU N. A survey of war games technology[J]. Ordnance Industry Automation, 2012, 31(8): 38-41, 45.

[2]
柳玉, 文家焱, 陈建华. 计算机兵棋系统发展及应用研究[J]. 兵工自动化, 2015, 34(8): 20-26.

LIU Y, WEN J Y, CHEN J H. Development and application of computer war games system[J]. Ordnance Industry Automation, 2015, 34(8): 20-26.

[3]
罗俊仁, 张万鹏, 项凤涛, 等. 智能推演综述: 博弈论视角下的战术战役兵棋与战略博弈[J]. 系统仿真学报, 2023, 35(9): 1 871-1 894.

LUO J R, ZHANG W P, XIANG F T, et al. Survey on intelligent war gaming: tactical & campaign war game and strategic game from game-theoretic perspective[J]. Journal of System Simulation, 2023, 35(9): 1 871-1 894.

[4]
胡晓峰, 齐大伟. 智能化兵棋系统: 下一代需要改变的是什么[J]. 系统仿真学报, 2021, 33(9): 1 997-2 009.

HU X F, QI D W. Intelligent war gaming system: change needed by next generation need to be changed[J]. Journal of System Simulation, 2021, 33(9): 1 997-2 009.

[5]
XU J L, HU J, WANG S X, et al. Miao Suan war game: a multi-mode integrated platform for imperfect information game[C]// 2022 IEEE Conference on Games (CoG). Beijing. 2022: 457-464.

[6]
吴琳, 胡晓峰, 陶九阳, 等. 面向智能成长的兵棋推演生态系统[J]. 系统仿真学报, 2021, 33(9): 2 048-2 058.

WU L, HU X F, TAO J Y, et al. War gaming eco-system for intelligence growing[J]. Journal of System Simulation, 2021, 33(9): 2 048-2 058.

[7]
黄洪原. 浅议兵棋系统的发展及军事运用[J]. 中国军转民, 2022(16): 53-55.

HUANG H Y. On the development and military application of the war chess system[J]. Defence Industry Conversion in China, 2022(16): 53-55.

[8]
MCCREIGHT R. Scenario development: using geopolitical war games and strategic simulations[J]. Environment Systems & Decisions, 2013, 33(1): 21-32.

[9]
张佳琳, 赵琳. MWGM: 基于兰彻斯特方程的微观兵棋推演模型[J]. 计算机工程与设计, 2011, 32(11): 3 807-3 810.

ZHANG J L, ZHAO L. MWGM: microcosmic war game model based on Lanchester equation[J]. Computer Engineering and Design, 2011, 32(11): 3 807-3 810.

[10]
杨润青, 吴曦. 面向兵棋系统的卫星导航对抗行动推演模型研究[J]. 系统仿真学报, 2022, 34(10): 2 213-2 220.

YANG R Q, WU X. Research on satellite navigation confrontation deduction model for war game system[J]. Journal of System Simulation, 2022, 34(10): 2 213-2 220.

[11]
曹占广, 陶帅, 胡晓峰, 等. 国外兵棋推演及系统研究进展[J]. 系统仿真学报, 2021, 33(9): 2 059-2 065.

CAO Z G, TAO S, HU X F, et al. Abroad war gaming deduction and system research[J]. Journal of System Simulation, 2021, 33(9): 2 059-2 065.

[12]
王佳宝, 任林林. 兵棋推演: 模拟未来战争的“战场元宇宙”[J]. 中国军转民, 2022(19): 68-70.

WANG J B, REN L L. War chess deduction: simulating the “battlefield meta-universe” of future war[J]. Defence Industry Conversion in China, 2022(19): 68-70.

[13]
HUANG J D, FAN Q Z, LI Y, et al. Design of a computer war gaming system[C]// 2021 IEEE International Conference on Unmanned Systems (ICUS). Beijing. 2021: 1 000-1 005.

Outlines

/