关联知识反映了一个事件和其他事件的依赖或关联,通过关联知识的分析,可以找到现实中事物间的某些规律并指导工作实践。关联规则挖掘的目的就是发现隐藏在海量数据中的关联知识,帮助用户找到有用的信息,为用户合理决策提供有效支撑。当前,关联规则挖掘已在商业、教育、医疗等领域广泛应用并取得了很好地效果
[1]。顾苗将关联规则挖掘运用于招聘信息系统中,通过对企业招聘信息的挖掘,得到不同企业的招聘要求倾向,为用户提供了有用参考
[2]。汪丽等对分布式数据挖掘方法进行了研究,并将其运用到教育决策支持系统中,帮助用户查找有用的决策信息
[3]。高生鹏通过对子宫肌瘤治疗相关数据进行关联规则挖掘,得到该疾病治疗效果与药品种类和用药量的关联程度,为优化疾病的治疗方法提供了参考
[4]。王圣通过对大量物流交易数据的关联规则挖掘,提出了改进实际物流业务和库存管理相关建议
[5]。庄细清通过对公司大量交易数据进行关联规则挖掘,为公司提出了最佳促销方案和最可靠商品售卖组合等个性化推荐
[6]。刘惠通过对海量物流信息进行关联规则挖掘,实现了货物运输平台信息的推荐功能,帮助用户根据运输货物选择最佳运输平台
[7]。李政等对关联规则挖掘在电子对抗目标分析中的应用进行了研究,提出采用频繁模式增长挖掘算法进行关联规则挖掘,取得了较好效果,有效增强了作战决策的合理性
[8]。芮少辉等人通过对航空发动机工作日志进行关联规则挖掘,较好地实现了航空发动机的故障检测
[9]。
信息网络和计算机技术的发展,各类传感器和智能设备广泛运用于作战实验中,促使作战实验采集的数据急剧增加,这些海量的数据中蕴含了丰富的军事知识。受存储和计算能力等因素的限制,传统数据分析方法不能很好地满足海量作战实验数据分析要求。鉴于此,本文将分布式存储和并行计算技术运用到作战实验数据分析中,构建了海量数据关联规则挖掘框架,明确了挖掘流程,并对现有关联规则挖掘算法进行了改进。最后,设计了一个简单的作战实验数据关联规则挖掘案例,验证所提框架和流程的有效性以及改进后算法的挖掘效率。