Ho un sistema di messaggistica interno, simile a un broker di messaggi. Abbiamo un broker di messaggi master e un broker di messaggi slave. Un broker di messaggi riceve solo messaggi e li invia a tutti i nodi. Lo slave agisce come un nodo, riceve messaggi dal master e dallo stato di costruzione in modo che possa subentrare in caso di errore principale.
Ora il mio problema è: come posso rilevare, se possibile e senza intervento umano, che il master è morto !? Il maestro può sembrare morto e lo schiavo potrebbe essere tentato di prendere il sopravvento, ma poi potresti finire nella situazione di due padroni nel tuo sistema.
Sto cercando di capire in che modo i sistemi di cluster implementano il rilevamento dei guasti master. Fino ad ora sembra che un essere umano debba uccidere manualmente il master e attivare uno slave, ma sarebbe molto più preferibile che questo processo fosse automatico.