"The Cloud" è solo un mucchio di macchine che non possiedi. L'esecuzione su queste macchine non è diversa dall'esecuzione sui computer che fanno proprio, eccetto che si paga per il tempo e la larghezza di banda.
Se utilizzi uno strumento come Hadoop, aggiungere macchine è solo una questione di configurazione (non parli di piattaforma, ma è il giocatore principale nella mappa non di Google - ridurre lo spazio, che è solo uno dei tecniche big-data).
La mia raccomandazione è che si lavori attraverso il tutorial, si esegua un'implementazione single-node dell'applicazione in esecuzione, quindi immediatamente si sposti su un servizio cloud come Amazon EC2. Puoi iniziare con due piccole istanze per circa un dollaro al giorno e aumentare il numero di macchine da lì.
Come nota cautelativa: a meno che tu non abbia a che fare con centinaia di gigabyte di dati (e preferibilmente con terabyte), non penso che vedrai molti vantaggi del ridimensionamento orizzontale o del "cloud". C'è un tempo non insignificante per impostare e smantellare le operazioni di riduzione delle mappe.