企业的可靠性工作效果不理想,并不是可靠性技术不行,大都是企业没干对。甚至有的企业将可靠性工作干成了给产品算命的玄学,算出的结果挺好,但产品用起来却故障不断。
一、先来个引子
2023年5月份,国内某知名公司(以下简称S公司)召开了一次小范围的网上会议,希望通过应用数学解决可靠性工程中的困难,S公司及其几个设备承制单位分别介绍了可靠性工作情况。会后,个人总结了S公司可靠性工作存在的几点问题。
1.可靠性工作体系不科学
S公司直接采用军工装备的可靠性标准,并不适用于S公司的产品特点和高可靠性高安全性要求,展示的可靠性工作体系貌似闭环,但难落地,无法有效指导设备承制方的可靠性工作。S公司应首先探索建立行之有效的可靠性工作指南和规范(这事需要外部支持),然后牵头建立行业可靠性标准体系。
2.错将可靠性评估作为工作重点
应用数学可以提供小样本、多源数据情况下的可靠性评估方法,相关研究在学术领域已经很成熟,足够满足工程应用。需要认识到可靠性评估并不是可靠性工作的重点,评估结果满足监管机构要求是工作结果,不能作为工作目的!可靠性评估对于提升可靠性作用有限,可靠性是研究产品故障发生、发展、控制等规律的学科,可靠性设计与分析才是工作重点。
3.未采用可靠性正向设计技术
S公司目前的可靠性工作中未采用正向设计的思路与技术,难以避免可靠性工作与装备研制工作的“两张皮”。可靠性正向设计的核心是从产品关键特性出发,构建出融合设计参数(材料、尺寸、位置等)与工作、环境参数的可靠性模型,基于模型确定、优化设计参数。
4.可靠性指标的分配、验证工作有问题
分配MTBF指标时候,不是下一层所有设备都需要参与分配,耐久性指标分配也是一样。可靠性指标的验证工作需要分阶段开展,方案阶段,基于手册的可靠性预计是验证MTBF(故障率),基于Pof模型的可靠性仿真是验证耐久性,如果验证不通过需要修正设计方案,然后进入样机研制阶段。研制定型阶段,需要通过样机鉴定试验进行可靠性指标验证,不能用可靠性预计或可靠性仿真代替。
5.未见区分基本可靠性与任务可靠性
可靠性指标分为基本可靠性(MTBF)与任务可靠性(MTBCF)两大类,基本可靠性高低决定全寿命周期维修成本,与维修性保障性紧密相关;而任务可靠性与安全性相关性强。S公司的整机可靠性指标貌似是从安全性指标确定出的,这样的话应该是MTBCF,但分配给供应商设备的却是MTBF(普遍为4万多小时),是不是搞混了?
6.错用GJB 899A指导耐久性评估
狭义的可靠性仅指故障率,可用浴盆曲线中的第2阶段表征,由于第2阶段呈现出恒定故障率,所以899A中采用指数分布建立统计模型。然而,耐久性与浴盆曲线的第3阶段相关,故障率不再恒定,不宜采用指数分布,因此也不能参考899A进行耐久性鉴定或评估。
7.盲信加速试验技术
面对高可靠性指标与短研制周期,加速试验技术虽然在理论论上非常适用,然而在工程实践中往往存在加速模型与加速系数不准的问题。设计出优良的加速试验需要开展多轮性能退化比对试验用于确定加速模型与加速系数,并不容易。有些产品利用现有技术手段难以加速其失效或退化,怎么办?模拟真实工况,开展一定时间的摸底试验也具有验证说服力。
二、到底是哪两条主线?
第一条,以可靠性指标为主线,包括可靠性指标(MTBF、故障率)与耐久性指标(可靠寿命、使用期限)的论证、分配、预计、验证、评估等。
第二条,以产品关键特性为主线,包括关键特性的识别、风险分析、正向设计、设计验证、生产控制、监测运维等。
S公司的问题:1)未将第二条线纳入可靠性工作流程中;2)第一条线如何落地尚没整明白。装备可靠性工作通用要求GJB 450B中没有指明第2条线,导致很多直接采用此标准的企业可靠性工作中存在“两张皮”,工作没少干,但对可靠性提升的作用有限。
第一条线有助于整机企业实现对供应链的可靠性管理,第二条线有助于企业在产品上实现可靠性,这两条线并不冲突,应该融合在一起建立可靠性工作流程。对于产品层级较低的零部件、元器件企业,应该以第二条线为主建立可靠性工作流程。