La struttura dei dati della tabella hash può essere facilmente diffusa su più macchine con un semplice algoritmo per distribuire le chiavi:
machine_to_query = item_key % machine_count
Quando si desidera leggere e scrivere coppie di valori chiave, si utilizza la chiave per capire quale macchina memorizza i dati, quindi si parla con quella macchina. Se desideri un conteggio del numero totale di elementi, devi richiedere il conteggio da ciascun server e aggiungerlo.
Quali algoritmi esistono per gestire in modo efficiente strutture dati in cui i dati sono partizionati su più macchine? Algoritmi distribuiti, non algoritmi paralleli.
In che modo qualcosa come un array ordinato può funzionare in modo distribuito? In modo efficiente.