In che modo Mercurial determina quali changeset ho bisogno quando tiro?

Question

In che modo Mercurial determina quali changeset ho bisogno quando tiro?

#1 da (7 voti)

4

Questa è una domanda sul funzionamento interno di Mercurial.

Ricordo vagamente un collega programmatore che mi spiega come funziona in modo indifferente quali changeset differiscono tra due repository e che ha una rapida soluzione al problema.

Qualcuno sa come funziona o può indirizzarmi verso un documento che descrive i dettagli?

mercurial algorithms

posta Robin 21.08.2013 - 09:11

fonte

1 risposta

Leggi altre domande sui tag mercurial algorithms

Per favore dimmi che non sono solo (non posso programmare su carta) [duplicato] Quanta logica può essere inserita in una classe di produzione di pool di oggetti prima che faccia più male che bene?

score 7 · Accepted Answer

Algorithm funziona nel modo seguente. Hai due repository: locale e remoto. Entrambi contengono un DAG di elenchi di modifiche.

L'obiettivo del protocollo di scoperta è trovare un insieme di nodi comuni , l'insieme di nodi condivisi da locale e remoto.

Uno dei problemi con il protocollo originale era la latenza, potrebbe potenzialmente richiedere molti roundtrip per scoprire che il repository locale era un sottoinsieme di remote (che è un caso molto comune, di solito si hanno poche modifiche rispetto all'upstream, mentre probabilmente l'upstream ha avuto molto sviluppo).

Il nuovo protocollo richiede solo un'interfaccia per il repository remoto: known() , che dato un insieme di liste di modifiche ti dice se sono presenti nel DAG.

L'algoritmo quindi funziona come segue:

Utilizzeremo tre set, common , missing , unknown . Originariamente tutti i nodi sono in unknown .
Prendi un campione da unknown , chiama remote.known(sample)
- Per ogni nodo che conosce il remoto, spostalo e tutti i suoi antenati in common
- Per ogni nodo che il remoto non conosce, spostalo e tutti i suoi discendenti in missing
Iterate fino a quando unknown è vuoto

Ci sono un paio di ottimizzazioni, prima è invece di iniziare con un campione casuale di dispersi, iniziare inviando tutte le teste, nel caso in cui il repository locale è un sottoinsieme, hai calcolato la risposta in un round trip.

Quindi puoi fare qualcosa di simile alla strategia di bisecatura utilizzata quando trovi i changeset difettosi. Invece di campioni casuali, puoi provare a selezionare nodi che massimizzeranno il numero di nodi che verranno classificati con esso (poiché anche tutti gli antenati o discendenti saranno contrassegnati).

Il risultato finale ha funzionato piuttosto bene.

Il codice è abbastanza leggibile se sei curioso: link