可靠性是产品在规定条件下和规定时间内,完成规定功能的能力。产品的可靠性能力通过可靠性指标进行衡量,在定义产品的可靠性指标前,根据可靠性的定义,应该明确以下四点:
1.产品定义——可以是系统、设备、零部件或元器件。系统分为多个层次,如汽车由各个子系统组成,每个子系统如发动机、变速箱本身又是系统,由设备和零部件组成。需求方可以仅在系统最高层次提出可靠性要求,也可以对一些对系统可靠性水平起决定性影响的子系统提出要求。由于实现系统的技术方案、设备组成存在差异,无法对所有组成系统的设备、零部件都提出要求;
2.规定的条件——指产品的使用条件和环境条件,产品所处的运行条件对可靠性指标有直接的影响,同一个类型的产品,在室外连续工作,缺少后勤支持的条件,和室内间歇性工作,有良好的后勤保障能力的条件下,对这个产品的可靠性要求差别很大;
3.规定的时间——也称为任务时间,规定时间的长短随着产品对象不同和使用目的不同而异。对一个产品来说,如果规定的任务时间很短,它可能是可靠的;若规定的任务时间很长,它就可能不可靠。规定时间根据产品的任务类别不同,也可以不用时间计算,而是采用其它量纲。如与工作次数有关的产品,像继电器、开关通过触点开关的次数进行表示,与行驶里程相关的车辆用里程进行表示。
4.规定的任务——产品所实现的功能。产品不能完成规定的任务就是发生了故障。故障根据对任务的影响程度不同,可以分为不同的类别,完全故障和局部故障,以一辆汽车为例,发动机发生故障汽车就无法完成行驶任务,是完全故障,而车辆内存在异响,影响乘车人的乘坐体验,是局部故障。可靠性是产品不出故障的概率,需要明确故障的类别和含义,如不能确定故障就无法计算概率。
广义的可靠性还包括维修性,维修性是针对可修复系统的,系统的状态分为工作和维修两种状态,处于工作状态占总体工作时间的比率称为可用性。可靠性、可用性、维修性、维修保障构成了RAM的概念,也称为可信性。
在了解可靠性的概念后,下面对一些常见的可靠性指标做个介绍:
可靠度R(t):可靠度是产品在规定的条件下,规定的时间内完成规定功能的概率,它是时间的函数。例如在1000小时后,平均100件产品中有96件产品工作正常,4件产品发生故障,则R(1000)=96%。
如上图所示,产品开始使用时,R(0)=100%,当产品的使用时间无穷大时,全部产品都会失效,即R(∞)=0.
对于不可修复的产品,可靠度可以估计为在规定的时间区间(0,t)内,能完成规定功能的产品数与该时间内投入工作的产品数之比。对于可修复的产品,可靠度估计为一个或多个产品的无故障工作时间达到或超过规定时间t的次数与观测时间内无故障工作总次数之比。
累积失效概率F(t):F(t)是产品在规定条件和规定时间内失效的概率,其取值等于1-R(t),也称为不可靠度。
失效率(Failure rate):失效率是以时间为变量的函数,指已工作到时刻t的产品,到时刻t后单位时间内发生失效的概率称为该产品时刻t的失效率函数,简称失效率λ(t)。失效率与时间的关系曲线有各种不同的形状,电子设备典型的失效率曲线为浴盆曲线,分为早期失效、偶然失效和耗损失效期三个阶段,机械设备的失效率三个失效期不明显。
失效率以百万小时故障数或十亿小时故障数作为单位称为FPMH(Failure per Million hours)或FIT(failure per billion hours)。例如产品的失效率为1FPMH,则该产品大约每百万发生失效一次。
平均故障间隔时间(MTBF):对于可维修产品的可靠性表征方法,在规定的条件下的特定测量期间,产品在其指定限值内运行的平均时间。计算方法为“产品的运行总时间/故障次数”。当产品的任务与其它量纲相关时,如工作周期、行驶里程,MTBF可以表示为平均故障间隔周期(MCBF),平均故障间隔里程(MKBF)。
平均故障前时间(MTTF):对于不可维修产品的可靠性表征方法,与MTBF的区别在于产品的不可修复,是失效前的平均工作时间。MTTF常对于组成系统的部件来定义,如使用了四个灯泡,分别运行了10000小时、11000小时、10500小时、11500小时烧坏了,则该款灯泡的MTTF是10750小时。如果想要获得更为可靠的灯泡,就需要更换个品牌,购买质量更好(价格可能也更贵)的灯泡。MTTF还可以对库存备件进行预估管理,当不准备更换灯泡时,则根据MTTF值可以估计需要在库存中预留多少个备件。
平均停机时间(MDT):产品处于停机状态且无法执行规定功能的时间间隔,MDT是产品无法正常运行的平均时间。MDT包括与维修、纠正性、预防性维护、自行造成的停机、物流和管理延迟的所有停机时间。平均停机时间等于确定时间区间内总停机时间与停机时间的比值。假设不考虑预防性维护,任何停机时间等于恢复时间时,MDT等同于MTTR。
平均运行时间(MUT):产品没有任何停机的连续运行时间。
平均修复时间(MTTR):平均修复时间是对产品因故障修复而停机的平均间隔时间。MTTR为故障修复组成的多个时间的总和。
MTTR=MFDT+MAD+MLD+MACMT=MFDT+MAD+MLD+MTD+MRT
MFDT:mean fault detection time 平均故障探测时间
MAD:mean administrative delay 平均管理延迟
MLD:mean logistic delay 平均后勤延迟
MACMT:mean active corrective maintenance time 平均主动纠正性维护间隔 MACMT= MTD + MRT
MTD:mean technical delay 平均技术性延迟
MRT:mean repair time 平均修复时间
可用性(A):可用性是对可靠性、维修性、维修保障的综合评价,计算方法为MUT/(MUT+MDT)。可用性的分类在很大程度上取决于在计算可用性时所用的宕机时间(Downtime,即停工期)的类型以及该可用性与时间的关系,分为固有可用性(Inherent Availability),可达可用性(Achieved Availability)和使用可用性(Operational Availability)。区别如下:
固有可用性Ai——停机时间仅考虑修复性维修,不包括预防性维修(Preventive Maintenance)宕机时间、物流时间,供应时间,行政管理工作导致的延迟。固有可用性取决于产品本身的可靠性和维修性,一般产品制造方选用固有可用性作为产品的可用性参数。Ai=MTBF/(MTBF+MTTR)
可达可用性Aa——停机时间考虑了所有原因导致的总停机时间,不仅考虑产品本身的可靠性和维修性,还考虑了预防性维修时间,不包括物流时间、等待时间、供应时间、行政延误等导致的宕机时间。Aa=MTBM/(MTBM+MTTMa)
使用可用性Ao——在实际的运行环境下,产品在实际的维修保障条件下正常运行的概率。考虑了操作和维护人员的数量、维修保障条件,反映产品的实际运行状态。
下面是Ai,Aa和Ao三种不同可用性指标计算的示例。
以上是一些常见的可靠性指标类型,在不同的行业领域中,还会在基本的可靠性指标基础上进行细化和调整,更为准确地规定对应产品的可靠性能力。