中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
Weapon & Euipment

Outlier handling methods for aircraft test results

  • LI Yulong
Expand
  • Element of PLA 91550 Unit, Dalian 116023, China

Received date: 2025-01-09

  Revised date: 2025-02-11

  Online published: 2026-03-25

Abstract

In response to the issue of individual outliers in aircraft testing affecting the determination of results and equipment standardization,this paper analyzes the relevant practices of outlier handling,based on the essential characteristics and internal logic of complex experimental samples,establishes a statistical descriptive model for multivariate data and unrelated multivariate test results,decouping the comprehensive evaluation problem under multiple constraints,combining specific examples,a comparative analysis was conducted on the analysis and handling methods of outliers from the aspects of inspection schemes and historical information validity,provides a scheme for eliminating invalid samples that can utilize experimental information,and proposes suggestion for improving relevant standards and regulations and conducting in-depth research,it can provide reference for engineering applications of related systems.

Cite this article

LI Yulong . Outlier handling methods for aircraft test results[J]. Command Control and Simulation, 2026 , 48(2) : 148 -151 . DOI: 10.3969/j.issn.1673-3819.2026.02.021

飞行器试验中会遇到有些数据偏离正常值,其中有的是产品自身原因造成的,也有的是由外围因素造成的,对于异常值的处理是需要审慎对待的问题,也是各方关注的焦点问题之一。对于异常值的处理,研究较多的是其检测识别问题,就是在对问题成因不够清楚的情况下,运用统计学的各类判别准则确定异常值。本文重点讨论的是成因较为清楚的、由外围因素造成的异常值处理问题,尤其是做剔除处理后,其信息利用方面的问题。目前,有的领域做剔除处理后信息全部舍弃,有的还做适当保留,做法并不统一,可能的原因是飞行器试验每个样本都带有大量的综合性试验信息,尤其是大型复杂装备,试验信息的全部清除和舍弃不是一件能轻易做出决定的事情。

1 异常值处理的有关做法

对于异常值的处理,目前认识比较一致,通常进行结果剔除,之后补充试验,但在细节上也存在一些差别,主要是异常值剔除后的具体处理方面。国家标准GB 4883—85《数据的统计处理和解释-正态样本异常值的判断和处理》要求对检出异常值,应尽可能寻找产生异常值的技术上、物理上的原因,以作为处理异常值的依据,允许剔除异常值,即把异常值从样本中排除,并追加适宜的观测值加入样本,也可以在找到原因时修正异常值[1]。对于可疑结果,若查明了是由于过失或试验条件产生了突变而产生,那么该可疑结果就是反常结果,在处理数据时应该进行剔除[2]。有的文献还强调了误差修正,如由于剔除问题是剔除含有过失误差的结果,试验中若发现有过失误差,首先要寻找原因,在找出原因而无法修正时,应断然加以剔除[3]。有的文献强调剔除的必要性,如对于反常结果,必须坚决剔除,否则可能将本来合格的产品误认为不合格品,将会延误新器材的研制周期或造成产品不必要的报废[4]。有的标准规定稍详细一些,如由于产品以外的设备发生故障,导致产品飞行试验故障,应剔除该产品的试验结果,在排除故障或更换设备后,用备份产品按原序号重试一次[5]。也有观点认为,对于科研中出现的离群值(也就是异常值),很可能代表着一些未知的因素。在这种情况下,对于离群值的保留和深入分析就有可能带来新的发现[6]。综上,产品因非自身原因导致的异常值,多数做法是进行剔除,少数强调进行修正。但剔除到什么程度,对于复杂装备系统剔除哪些信息,并没有详细阐述,这会导致在具体工程实践中,不同的单位和个人会有不同的理解。

2 飞行器试验结果的统计学描述

为便于把握飞行器试验结果构成的本质和内在逻辑,需要从理论上进行分析,抽象出相关统计学模型。如果仅考虑问题的某一特征(一个变量),则是一元统计问题,若要同时考虑多个特征且要体现多个变量(指标)之间的相关性,这就是多元统计分析问题。多变量统计数据的典型案例包括对人的特征的统计,如每个人都有身高、体重等多种特征,每个样本都集中了几个变量。人均消费支出的统计分析,则包括了衣着支出、居住支出、设备支出、交通支出、通信支出、娱乐支出、教育支出、医疗支出等诸多变量[7]。这些都是多元统计分析的典型对象。
飞行器试验统计本质上是多元统计分析的一个特例,因为要考虑可靠性、精度等多个变量(指标),但多元统计分析还要考察变量之间的相关性。飞行器试验获取的是从属于多个变量的多元数据,多个变量形成的数据集将是一个随机矩阵[8]。设试验获取的数据集构成的矩阵为X,其数学表达式为
X= x 11 x 12 x 1 p x 21 x 22 x 2 p x n 1 x n 2 x n p
式(1)中,xij是第i个样本的第j个变量的观测值,n是观测的个体数(样本数),p是变量的个数。如果从变量的角度来看,上式还可改写成以下形式:
X=(x1,x2,…,xp)
xj=(x1j,x2j,…xnj)'
式(2)是把数据集表达为p维列向量形式,某一列就是一个变量的样本信息。对于p维随机向量,其每一个分量都是一个一维随机变量,可以单独研究。
式(3)中xj是单变量所对应的列向量,元素是单变量在各样本上的观测值,如可靠性、精度等在各次试验中的实测结果。
飞行器试验数据的统计学描述使得异常值处理问题变得易于理解和分析,下面通过样例进一步体现变量和样本之间的逻辑结构。飞行器试验结果评定的任务,既包括检验p个变量是否分别达到指标要求,也包括检验单个样本是否满足合格判据要求,还包括检验合格样本数量是否满足合格判据要求。从判据的角度看,有时要求单样本各指标均合格的情况下单样本才能评判为合格,有时则不做要求,指标的评判亦然,具体的和试验检验方案有关。在某飞行器对固定目标打击试验中,针对射程、抗干扰、突防、精度和可靠性等30个战技指标,综合设计了20个飞行试验样本进行考核,即p=30,n=20,获取了含异常值信息的飞行器试验结果(见表1)。
表1 含异常值信息的飞行器试验结果样例

Tab.1 Example of aircraft test results with outlier information

样本编号 指标1
(射程)
指标2
(抗干扰)
指标3
(突防)
指标4
(精度)
指标30
(可靠性)
单样本评判结果
样本1 900 km 1 1 1 1 合格
样本2 200 km 1 1 0(异常) 1 合格
样本3 300 km 1 1 1 1 合格
样本4 700 km 1 0 1 1 合格
样本20 50 km 0 1 1 1 合格
指标评判 合格 合格 合格 合格 合格
试验结果 合格

注:表中1、0代表合格、不合格等成败型结果。

表格从横向上看,是同一样本的不同指标变量观测结果,纵向上看,是同一指标变量在不同样本上的观测结果。这个含有异常值信息的样表里面,失败值(不合格)不一定都是异常值,如第4个样本的突防试验结果、第20个样本的抗干扰试验结果。由于非产品自身原因导致的失败才是异常值,如第二个样本的精度试验结果,通过试验结果综合分析可以确认是因试验条件变化导致的异常值,则其可归属于单个变量值表现异常问题[9]。在能够确认是由于非产品自身原因导致失败的前提下,剔除异常值本身,这个观点都能被普遍接受。而剔除无效样本,则意味着要剔除的是样本2的全部信息(包括射程、抗干扰、突防和可靠性等试验信息),甚至还包括样本2产品本身所经历的其他试验(如地面试验)等环节、阶段的其余试验信息,剔除后需要进行补充试验,势必会造成人力、物力的消耗。

3 异常值处理方法分析

如果某样本的指标变量因为客观原因导致异常,其反常结果的处理除了剔除之外还有进行修正的办法可以选择,如能进行很好的修正,那么这种处理方式应当是最为合理的,前提是机理清楚,但飞行器某些指标修正问题过于复杂,甚至修正后的可信性都会受到质疑,因此多数情况下,在飞行器试验领域,修正的办法行不通,迫不得已进行无效样本的剔除。按照各类标准规范和文献的统一认识,对该样本进行剔除处理,然后进行补试。但是,被剔除的试验结果,在它的信息利用上,目前有不同的处理方法,这一点在实践中尚无定论。
处理方法一,基于要追加新样本的考虑,用新的样本完全代替原样本重新开展试验,各指标均会得到新的试验数据,因此该样本的信息全部舍弃。处理方法二,剔除该样本的单样本试验结果和异常值,保留该样本的其余信息,在指标间无关联的情况下,其余指标获取的信息有效,因此保留其余指标信息用于指标评定。
两种处理方法各有优点和不足。方法一简洁明了,无论是单样本还是指标方面不改变原检验方案,不足是在含有异常值的样本里面的重要信息会被清除,比如该样本与其余几个样本进行了连射,补充样本的时候很难再同时补充几个样本;再如,该样本是在难以遇到的复杂环境下开展的,同样在补充样本的时候很难遇到。还有,如果该样本在地面试验中出现了故障,那么故障信息也将因为判定无效而消失,这样处理也似乎有悖考核初衷,从这个角度上讲,最多剔除飞行试验结果。方法二剔除了无效信息而保留了其余诸多信息,承认样本除异常值外在经历各阶段试验时的有效性,包括其余有利和不利的信息,等于在价格昂贵的飞行器试验中增加了试验信息,有利于提高试验的充分性。从某种意义上来说,采用这种方法,可以采用简化的补试方案,降低试验消耗,可以着重考核判为无效的那一部分。不足是会改变原有检验方案,因为对于其余指标来说增加了样本量,而且多的是一个不完整的样本,还可能夹杂着部分不利信息,会引起新的争议。
方法二的理论依据是,从前述统计学的描述上来看,这是一个多变量的数理统计问题,各指标间在无关联的情况下,可以各自进行单独研究,只是我们在进行综合评定时进行了多重约束,如单个产品有合格判据,单个指标也有合格判据,整个试验还有合格判据,但这些都没有改变统计学意义上的变量独立性。在多元统计分析领域,出于关联分析的需要,要求数据集各元素的完整性,不能出现数据的缺失,但我们这个特例恰恰不关心数据(指标)的关联性,或者说较少,强调更多的是综合达标性。另外,出现无效信息的样本可能还夹带着飞行试验以外的一系列试验信息,如各类、各阶段地面试验等,在产品鉴定定型和批检验收等各阶段也有不一样的影响,如果全部剔除,可能带来的损失较大。总的来说,该方法更符合统计检验的初衷,那就是更充分地获取信息,信息获取和利用得越充分,检验评估结论才能越客观,至于那些会遇到的问题,可以实事求是地采用相应的统计学方法去妥善处理和解决。从这个意义上讲,方法二具有更好的现实效益。
鉴于对该问题的理解存在分歧,而且对具体执行有一定影响,有必要对相关标准规范做进一步的细化明确。就像国家标准中提到的,把异常值从样本中剔除,在我们的例子中就会有不同的理解,是把某个样本中的异常值剔除,还是把含有异常值的样本剔除。再如,军用标准提到的,应剔除该产品的试验结果,那么是剔除产品的全部结果还是产品本身的成败结果,都是有差别的。同时,在统计学相关领域,有进一步深入研究的必要,为相关信息的利用提供更为坚实的理论基础。还有,对于我们所探讨的问题,因其能够从客观条件中得到合理的解释[10],研究数据修正的方法具有更为现实的意义,比作为无效样本进行剔除更为科学,也就是要求从工程本身去解决异常值处理和利用的问题。

4 结束语

飞行器试验具有不可重复性,产品价格昂贵,人力物力消耗大,在含有异常值的样本信息利用上,目前处理方法并不统一。本文从标准、规范、文献的角度进行了比较研究,用多元统计分析理论进行了飞行器试验结果的统计学描述,使得多重约束下的综合评定问题得以解耦,对比分析了不同处理方法的特点和不足,推荐使用可充分利用试验信息的处理办法,工程实践中还需要具体问题具体分析。本文提出了完善标准规范及深入开展相关研究的建议,希望操作性和针对性更强,从而减少或避免各方理解上的分歧。
[1]
张镇炎. 产品质量检测中试验数据异常值的处理[J]. 电子产品可靠性与环境试验, 2007, 25(1): 22-24.

ZHANG Z Y. Treatment of outliers of test data in product quality inspection[J]. Electronic Product Reliability and Environmental Testing, 2007, 25(1): 22-24.

[2]
潘承洋. 武器弹药试验和检验的公算与统计[M]. 北京: 国防工业出版社, 1980.

PAN C Y. Calculation and statistics of weapons and ammunition test and inspection[M]. Beijing: National Defense Industry Press, 1980.

[3]
中国华阴兵器试验中心. 兵器试验理论研究与实践: 闫章更学术讲座及论文选[M]. 北京: 国防工业出版社, 2013.

China Huayin Weapon Testing Center. Theoretical research and practice of weapon test: Yan Zhanggeng's academic lectures and selected papers[M]. Beijing: National Defense Industry Press, 2013.

[4]
吕福生. 布雷弹交验定型试验反常结果的剔除[J]. 工兵装备研究, 1999(5):12-17.

LYU F S. Elimination of abnormal results in the testing and finalization of mine laying bombs.[J]. Engineer Equipment Research, 1999(5):12-17.

[5]
地空导弹武器系统检验验收规程: GJB 3974—2000[S].

Inspection and acceptance procedures for surface-to-air missile weapon systems: GJB 3974—2000[S].

[6]
朱嘉欣, 包雨恬, 黎朝. 数据离群值的检验及处理方法讨论[J]. 大学化学, 2018, 33(8): 58-65.

ZHU J X, BAO Y T, LI C. Discussion on the method for testing and treating outliers[J]. University Chemistry, 2018, 33(8): 58-65.

[7]
谢贤芬, 王斌会. 我国农村居民消费区域差异的多变量统计分析[J]. 特区经济, 2011(4): 177-179.

XIE X F, WANG B H. China countryside citizen consumer district difference's variable calculation analysis[J]. Special Zone Economy, 2011(4): 177-179.

[8]
王斌会. 多元统计分析及R语言建模[M]. 4版. 广州: 暨南大学出版社, 2016.

WANG B H. Multivariate statistical analysis and modeling for R language[M]. 4th ed. Guangzhou: Jinan University Press, 2016.

[9]
赵慧, 甘仲惟, 肖明. 多变量统计数据中异常值检验方法的探讨[J]. 华中师范大学学报(自然科学版), 2003, 37(2): 133-137.

ZHAO H, GAN Z W, XIAO M. The method of judging outliers in multivariate statistical data[J]. Journal of Central China Normal University(Natural Sciences), 2003, 37(2): 133-137.

[10]
胡上序, 陈德钊. 观测数据的分析与处理[M]. 杭州: 浙江大学出版社, 1996.

HU S X, CHEN D Z. Analysis and processing of observation data[M]. Hangzhou: Zhejiang University Press, 1996.

Outlines

/