Percorso della replica

1

Attualmente sto sviluppando un sistema di replica per mantenere i dati in-synch tra un numero arbitrario di server.

Alcuni di questi server sono presenti in un cluster su una LAN. Altri esistono da qualche altra parte nel mondo.

Mi chiedo quali sono i pro / contro dei diversi percorsi che scegliamo di trasferire i dati replicati tra i server?

In altre parole, quali sono le diverse strategie per bilanciare il carico del processo di replica?

    
posta geeko 21.05.2011 - 21:58
fonte

2 risposte

2

Ciò dipenderebbe totalmente dai requisiti di replica.

  1. Vuoi coerenza immediata su tutte le caselle? (In tal caso, la scelta è semplice: replicare rt e gestire gli errori / la bassa velocità).
  2. Volete tolleranza garantita contro i guasti del datacenter?
  3. Quanti dati puoi permetterti di perdere in questo caso? Ciò determinerebbe la frequenza con cui si spostano i dati su wan.
  4. Sono disponibili data center locali che possono contribuire ad alleviare tali errori a livello di data center? (Questo sarebbe ancora nei guai se l'intera città dovesse andare a male a causa di un terremoto, diciamo). Ma i vantaggi qui sono molto buoni: puoi avere un anello in fibra locale e replicare rapidamente se stai bene con tali guasti.

La consistenza finale a lungo termine complessiva tramite backup programmati funziona per molte persone. Alcuni altri scelgono la coerenza finale a breve termine replicando in tempo reale. Alcuni altri scelgono ancora più configurazioni "online" in cui è necessario eseguire il commit su almeno due datacenter. Ci sono sistemi che hanno la consapevolezza della posizione incorporata nei loro server, quindi questi potrebbero garantire di dover eseguire il commit da una posizione all'altra. E c'è l'altra estremità della replicazione: un'immediata consistenza immediata, ovunque.

    
risposta data 24.05.2011 - 04:22
fonte
2

Paxos è un algoritmo che può essere utilizzato per la replica attivo-attiva tra più master. Nella versione (brevettata) che usiamo, è stata migliorata per funzionare bene in un ambiente WAN.

Una buona caratteristica è che tutte le condizioni di errore sono contenute nell'algoritmo, quindi i problemi di perdita di dati o perdita di pacchetti non sono una minaccia per la sicurezza dei dati. La quantità di dati che puoi permetterti di perdere può essere zero. (Supponendo che l'intero universo non venga fatto saltare in aria contemporaneamente).

    
risposta data 11.04.2013 - 00:10
fonte

Leggi altre domande sui tag