通过寿命试验可以对产品的可靠性水平进行评价,并通过质量反馈来提高新产品可靠性水平。 在合适工作条件下器件使用寿命期内的故障率很低。电子元器件的寿命,与工作温度是有密切关系的。以电脑主板上常用的也常出故障的电解电容器为例,其寿命会受到温度的影响。
在常规环境中要测试出产品的mtbf时间需很长时间,需投入大量的金钱与时间,因此可在实验室中以加速寿命的测试方案,在物理与时间上加速产品的劣化原因,以较短的时间试验来推定产品在正常使用状态的寿命或失效率,但基本条件是不能破坏原有设计特性。 一
比如:mtbf中的故障数可以近似理解为outage,系统重启属于total outage, 模块crash属于partial outage
mtbf测试报告提升可靠性都是需要降低故障数减小downtime
在系统和应用设计中都需考虑如何减少错误,或者出现错误如何恢复。
终端上的一些后台服务可以近似理解为服务端应用,虽然不能完全照搬上文中提到容灾和恢复的场景,但是可以借鉴其中的一些思路。
终端上可以通过参考dpm的概念增加数据衡量指标,但可能不需要也不现实每个场景都执行100万次操作,可以依据实际情况调整标准要求
可以参考failover策略中错误探测,隔离,恢复的操作在出现错误时及时发现,快速恢复重新启动来减少对用户造成的负面影响,恢复时间即failover recovery time就成了一个关键指标
深圳市讯科标准技术服务有限公司
13266613200
qq: 3366783178