In genere la replica viene utilizzata per il trasferimento dei dati da sito a sito.
La tolleranza ai guasti è tutta una questione di ridondanza. Più il tuo sistema è ridondante e più tollerante è per i guasti. Molti possono essere risolti attraverso l'infrastruttura, piuttosto che il codice, specialmente per un database.
Si spera che il server abbia dischi rigidi ridondanti che possono essere sostituiti a caldo in caso di guasto. Pertanto, il server stesso deve disporre di funzioni ridondanti come alimentatori hardrive, ecc.
Ma se il server si arrestasse in modo anomalo, allora ci troviamo nel clustering di failover, questo è quando un altro server subentra senza problemi in caso di guasto di un server. In questo caso, sarebbero disponibili più nodi. Di solito uno è attivo e l'altro passivo in attesa di fallimento.
Quindi è un fallimento più grave, un crash del data center, ad esempio un terremoto o qualche altro atto di dio. In questo caso, un altro centro dati avrebbe preso il sopravvento. In questo scenario è più probabile che i dati vengano replicati da un sito all'altro.
Tutti costano più denaro per l'implementazione e la manutenzione. Dipende dalla gravità dei dati e dalle richieste del cliente. In alcuni casi, solo un backup notturno lo farà.
Speriamo che il tuo sistema bancario online stia usando più di quello.
Non so quali sono i tuoi requisiti, ma quelli sono gli scenari e i livelli di escalation più comuni.