|
高可用性系统,定义为系统中软硬件各个模块单元可以长时间无故障工作,有容错能力及故障自我恢复能力。即一个用户能在指定的时间内几乎随时都能使用的系统。可用性,用百分比可表示为实际的服务时间与要求的服务时间的比值。目前许多在移动通信、证券银行、气象卫星监控等服务质量要求非常高的系统都需要1年365天,每天24小时,不间断、稳定、无故障地连续工作,也称7*24或365*24。
一个可用性为99.9%的365*24系统,1年允许的平均故障时间为8.75小时。可用性也可以用系统的失效效率来计算,结果为平均无故障工作时间MTBF(Mean Time Between Failure),也可以用系统平均故障修复时间来计算,结果为平均故障修复时间MTTR(Mean Time to Repair),将MTTR时间平均分摊到MTBF周期内,就可以计算出任意元件对平均故障的贡献。基于这些统计,可用性可以表示为MTTF/(MTTF+MTTR)*100%
拿这个嵌入式监控系统例子来看,需要测试系统级和组件级冗余来保证系统稳定性和健壮性,即高可用性。为了提供故障响应时间和故障修复效率,故障自检机制测试很重要,即涉及对检测进程和备用线程和看门狗程序的测试 |
|