Miglioramento della disponibilità rispetto al tempo medio tra i guasti

-1

Supponiamo che io abbia a che fare con un sistema inaffidabile a cui molti utenti accedono / fallisce, diciamo X volte per X minuti settimanalmente. Se solo una delle seguenti cose può essere migliorata per qualsiasi motivo, cosa è più importante: garantire il doppio della disponibilità del servizio o raddoppiare il tempo medio tra i guasti ?

Interessato a sentire la tua opinione.

Grazie

Claudio

    
posta Claudio 04.10.2018 - 06:18
fonte

2 risposte

2

Se i tuoi sistemi cadono per T minuti X volte a settimana e assumendo un'operazione 7/7 24/24:

  • il tempo di inattività totale nella settimana è T*X .
  • la disponibilità relativa A è 1-(T*X)/(7*24*60) (assoluto è 7*24*60-T*X )
  • il suo MTBF è (A * 7*24*60)/X o 7*24*60/X-T

In altre parole,

  • aumentare A significa diminuire T o X o entrambi
  • aumentare MTBF significa ridurre X o T o entrambi

Quindi entrambi sono solo due lati della stessa medaglia e qualunque cosa tu faccia per migliorarne uno andrà a beneficio dell'altro

Modifica: non ho notato il "doppio" nella tua domanda:

Suppongo che T sia piuttosto costante (ad esempio, ora di riavviare il server):

  • Non puoi raddoppiare la disponibilità se è superiore al 50%. Ma se la disponibilità è inferiore, raddoppiarla significa ottenere un miglioramento molto elevato.

  • Puoi sempre raddoppiare il MTBF. Tutto ciò che serve è approssimativamente dimezzare X.

risposta data 04.10.2018 - 07:55
fonte
2

[Questo è iniziato come un commento, ma ho esaurito la stanza. Quindi, sto postando come risposta.]

If only one of the following can be improved due to whatever reason, what's more important: ensuring double the availability of the service or double the mean time between failures?

L'importanza relativa della disponibilità rispetto all'MTBF dipende dall'utilizzo del sistema. Presumo che il lavoro dell'utente venga perso quando si verificano errori.

Se gli utenti lavorano in sessioni brevi (molto più brevi di MTBF), il lavoro viene raramente perso ai guasti. In questo caso, gli usi potrebbero anche non notare i guasti. In questo caso, la disponibilità potrebbe essere un problema più grande di MTBF.

Se gli utenti lavorano in sessioni lunghe (di lunghezza equivalente a MTBF), è probabile che il lavoro vada perso a causa di errori. La perdita di lavoro tende ad essere più fastidiosa della indisponibilità del sistema. In questo caso, MTBF potrebbe essere un problema più grande della disponibilità.

    
risposta data 05.10.2018 - 05:38
fonte

Leggi altre domande sui tag