In Hadoop, gli oggetti passati ai riduttori vengono riutilizzati . Questo è estremamente sorprendente e difficile da rintracciare se non te l'aspetti. Inoltre, il tracker originale per questa "funzione" non offre alcuna prova che questa modifica abbia effettivamente migliorato le prestazioni (a meno che non l'ho perso).
It would speed up the system substantially if we reused the keys and values [...] but I think it is worth doing.
Questo sembra completamente contrario a questa risposta molto popolare . C'è qualche credito per l'affermazione dello sviluppatore Hadoop? C'è qualcosa di "speciale" su Hadoop che invalida la nozione di creazione di oggetti a basso costo?