1 多层级智能体架构设计
1.1 整体架构设计
1.2 作战意图层
1.3 任务分配层
1.4 算子行动层
2 架构实现
2.1 基于有限状态机的策略制定
表1 作战意图层的变化情况(“事件”)Tab.1 Changes at the operational intent level ("events") |
| 事件 | 含义 |
|---|---|
| E1 | 兵力变为优势 |
| E2 | 分数从非优势变为优势,有第三方夺控点 |
| E3 | 分数从优势变为非优势 |
| E4 | 占领夺控点,有第三方夺控点 |
| E5 | 兵力变为优势,有非我方夺控点 |
| E6 | 分数从优势变为非优势,有非我方夺控点 |
| E7 | 失去夺控点,分数占劣势 |
| E8 | 分数从非优势变为优势,没有第三方夺控点 |
| E9 | 占领所有夺控点,兵力是非优势 |
| E10 | 分数从非优势变为优势 |
| E11 | 分数从优势变为非优势,无非我方夺控点 |
| E12 | 失去夺控点,分数占优势 |
| E13 | 占领所有夺控点,兵力占优 |
| E14 | 兵力变为优势,无非我方夺控点 |
| E15 | 兵力变为劣势 |
2.2 基于联盟博弈的协同任务分配
表2 基于联盟博弈的协同任务分配流程Tab.2 Collaborative task assignment process based on Alliance Game |
| 基于联盟博弈的协同任务分配流程 |
|---|
| 步骤1:根据作战意图形成初始的任务划分X1,…,Xn,并确定Xi(i=1,…,n)的任务类型和目标; |
| 步骤2:为Xi(i=1,…,n)分配算子,确定各算子任务,形成初始联盟 (i=1,…,n),令t=0; |
| 步骤3:根据式(1)计算联盟 (i=1,…,n)的效能值,更新最优联盟 (i=1,…,n); |
| 步骤4:使用最近邻搜索方法,调整联盟结构,得到 (i=1,…,n); |
| 步骤5:如果达到迭代结束条件,转步骤6;否则,令t=t+1,转步骤3; |
| 步骤6:输出最优联盟集合 (i=1,…,n)。 |
2.3 基于行为树的算子行为控制
3 实验
3.1 智能体各层级效果展示
表3 分队城镇居民地夺控战斗想定棋子部署表Tab.3 Group-level multi-air combat scenario chess deployment table |
| 阵营 | 棋子类型 | 车(班)数 | 分值 | 初始位置 |
|---|---|---|---|---|
| 红 | 中型坦克 | 2 | 30 | 2442、2542 |
| 红 | 重型战车 | 2 | 21 | 2443、2543 |
| 红 | 无人战车 | 2 | 20 | 2443、2543 |
| 红 | 步兵 | 2 | 12 | 2443、2543 |
| 红 | 巡飞弹 | 2 | 0 | 2443、2543 |
| 红 | 无人机 | 1 | 1 | 2344 |
| 蓝 | 重型坦克 | 1 | 30 | 4229 |
| 蓝 | 重型战车 | 2 | 21 | 4328、4428 |
| 蓝 | 无人战车 | 2 | 20 | 4328、4428 |
| 蓝 | 步兵 | 2 | 12 | 4328、4428 |
| 蓝 | 侦察型战车 | 2 | 15 | 4430、4330 |
| 蓝 | 无人机 | 1 | 1 | 4426 |
3.2 智能体表现
表4 智能体测试胜率统计Tab.4 Statistics on the success rate of intelligent agent testing |
| 想定 | 练习AI- 激进型 | 练习AI- 保守型 | 基准AI- 灵活型 | 基准AI- 保守型 |
|---|---|---|---|---|
| 想定Ⅰ | 80% | 60% | 70% | 90% |
| 想定Ⅱ | 70% | 70% | 80% | 80% |
中国指挥与控制学会会刊 