1 智能训练架构
1.1 智能训练架构
1.2 智能并行训练架构
2 基于仿真实验的智能并行训练方法
2.1 基于仿真实验的智能并行训练架构
2.2 面向智能训练的仿真实验管理
2.3 基于实验管控的智能并行训练流程
3 实例分析
3.1 实验设置
表1 智能体模型核心组件设计Tab.1 Design of core components of the intelligent agent model |
核心组件 | 详细设计 |
---|---|
观测空间S | 外部仿真环境反馈的我方飞机位置、速度、状态、载荷工作状态、目标感知信息。 |
决策空间A | 智能体决策内容包括平台机动方向、侦察方向、武器发射时机。 |
奖励函数R | 实时奖励包括侦察到目标、躲避武器跟踪等,全局奖励包括目标被摧毁。 |
神经网络ω | 输入网络采用全连接网络、特征转换网络提取兵力特征,采用长短时记忆网络处理历史信息;输出网络采用全连接网络生成决策策略选择。 |