可靠性是一个在产品的设计、制造和使用的每个环节中都存在的问题。简单地说,所谓可靠性就是产品不易发生故障的程度。众所周知,产品在出厂检验时通常都是合格的,但是随着时间的推移,产品的功能和性能会渐渐发生变化,最终导致故障的发生。虽然这一趋势无法改变,但设计、制造出在指定时间内不出现故障的产品却是企业和消费者都关心的话题。远到二战早期美军战斗机频频发生的通信故障,近到今年3·15期间屡屡曝光的某品牌笔记本电脑的质量问题,究其实质,都是产品可靠性不过关惹的祸。合理应用可靠性分析,可以帮助研发、工程、质量等部门的技术人员提高产品质量的稳定性,降低产品全寿命周期费用和售后服务成本,改善顾客的满意度和忠诚度。
令人不解的是,很多企业已经意识到可靠性分析的重要性,却依然在刻意地回避可靠性分析,这是为什么呢?原因很多,其中的一个主要原因是因为一般企业觉得常规的统计质量管理已经够复杂了,而可靠性的研究还需要用到许多更高深的统计学知识,这对于没有经过正规统计方法培训的人来说,会让人望而生畏,这在客观上大大限制了可靠性方法在企业的推广。
笔者尝试过用不同软件进行可靠性分析,SAS公司的高端六西格玛软件JMP(试用版可以在www.jmp.com/china下载)是其中之一, 其交互式可视化分析的特点在可靠性方面也有很好的体现。下面以一个典型的实例来看看如何用JMP做可靠性分析。
例: 某公司为了对一个电子产品进行可靠性分析,收集了一批该产品的使用寿命数据(如图一所示,当“删失”=0时表示“时间”是精确的失效时间,当“删失”=1时表示精确的失效时间不详,但肯定大于“时间”所显示的数值)。在这组具有代表性的数据下,我们来研究一下该产品的失效特性如何?当失效概率为90%时,该产品的可靠寿命是多少? (图片)
图一 可靠性试验原始数据表(部分) 按照可靠性方法的理论,要解决这两个问题,需要首先解决一个基本问题:这组寿命数据是服从什么分布的?实在地讲,这不是一个容易解决的问题,得一个一个分布地去尝试、去比较、去验证,什么威布尔Weibull分布啊,对数正态分布啊,指数分布啊,等等,少说也有十几种。而一般质量工程师一听这些专业的统计学名词就犯晕,而且由于寿命数据中又含有“删失”特性,判断起来就更复杂了,通常需要通过一系列冗长的统计分析报表和统计指标去判断。
笔者在用JMP软件做分析的时候,发现JMP中有一条命令叫“拟合所有分布”,它可以在几秒钟的时间内对所有常规的可靠性分布逐一拟合,然后自动筛选出最佳的分布拟合。比如在下图中,“对数正态”分布就是JMP在快速比较所有寿命分布后找到的最佳分布。如果不太懂统计学原理,只想直观地看一看这个分布长什么样的话,就看图上那个红色曲线及其周边粉红色的置信区间带;如果对统计学原理比较懂,想深入了解统计学上的判别依据,还可以看下面那个“模型拟合”表格中的相关指标。总之,可以各取所需,完成最基本的分布模型识别的任务。(图片)
图二 可靠性分布模型比较的可视化展示 此外,在获得最佳拟合分布的同时,与该产品质量相关的各种可靠性特征(如可靠寿命、失效概率、失效概率密度、故障率等等)也可以用图形化方式来表现。比如在下图中,“分布刻画器”和“分位数刻画器”都显示了失效概率与产品寿命之间的关系(两者的主要差别是X轴和Y轴所代表的变量正好相反),“危险率刻画器”显示的是危险率(即通常所说的Hazard Rate)随产品寿命的变化而产生变化的规律(这可以用来实现可靠性理论中最著名的“浴盆曲线”),“密度刻画器”显示的是失效概率密度随产品寿命的变化而产生变化的规律。(图片)
图三 可靠性分析中主要特征变量的刻画器 利用这些图形就可以形象地解释第一个问题“该产品的失效特性如何?”了。现在我们来回答第二个问题“当失效概率为90%时,该产品的可靠寿命是多少?”在“分位数刻画器”的X轴上输入“0.9”,就可以在Y轴上得到红色数值“412.0117”和蓝色数值“[278.675,609.146]”,表明此时的可靠寿命应该是412.0117,其置信区间应该是[278.675,609.146]。
关于可靠性分析的内容还有很多,比如加速寿命分析、寿命数据的回归分析和可维修性分析等等。这些在JMP软件中都有对应的图形化智能分析平台,一个很直接的好处是可以让非统计专业背景的工程师迅速跨越统计学的壁垒,直接进行技术问题的分析和研究,进而提升产品的可靠性,降低顾客投诉率以及售后服务成本。
6/3/2010
|