Domande con tag 'hadoop'

2
risposte

Può ridimensionare la mappa dire "Hello World"?

Raccogliendo che la riduzione della mappa viene utilizzata per elaborare enormi quantità di dati, ho deciso di capirlo. Le mie query erano: Quale classe di problemi mira a risolvere? In che modo aiuta a risolvere problemi complessi? P...
posta 04.07.2011 - 16:55
2
risposte

Ottimo modo per memorizzare 18 miliardi di chiavi, coppie di valori [chiusa]

Ho circa 200 milioni di nuovi oggetti in arrivo e una politica di conservazione di 90 giorni, quindi mi rimangono 18 miliardi di record da memorizzare sotto forma di coppie chiave-valore. Chiave e valore saranno entrambi una stringa. Si tratt...
posta 05.06.2013 - 20:12
2
risposte

come convincere gli altri dovremmo passare al hadoop?

Tutto ciò che ho letto su Hadoop sembra esattamente la tecnologia di cui abbiamo bisogno per rendere la nostra azienda più scalabile. Abbiamo terabyte di dati grezzi che sono in forma non relazionale (file di testo di qualche tipo). Ci stiamo ra...
posta 15.03.2011 - 05:38
2
risposte

Java asincrono

Mi chiedo se volessi implementare un servizio web basato su java che fa analisi web, che tipo di architettura dovrei usare. L'attuale elaborazione dei Big Data sarebbe effettuata da Hadoop. Tuttavia non sono sicuro di cosa avrei bisogno di fa...
posta 23.02.2012 - 03:53
3
risposte

Perché i cluster HDFS hanno un solo NameNode?

Sto cercando di capire meglio come funziona Hadoop e sto leggendo The NameNode is a Single Point of Failure for the HDFS Cluster. HDFS is not currently a High Availability system. When the NameNode goes down, the file system goes offline. T...
posta 04.04.2012 - 05:07
1
risposta

Hadoop e riutilizzo degli oggetti, perché?

In Hadoop, gli oggetti passati ai riduttori vengono riutilizzati . Questo è estremamente sorprendente e difficile da rintracciare se non te l'aspetti. Inoltre, il tracker originale per questa "funzione" non offre alcuna prova che questa modif...
posta 11.02.2014 - 16:37
3
risposte

La certificazione cloudado hadoop vale l'investimento [duplicato]

Sto considerando di investire tempo per imparare Hadoop e le sue tecnologie correlate. Il problema è che il mio attuale lavoro non utilizzerà Hadoop in tempi brevi e, anche se imparo da libri, blog, progetti personali, non avrò molto da fare d...
posta 23.12.2011 - 21:33
2
risposte

Ricerca testuale: problema con i big data

Ho un problema che speravo di poter ottenere un consiglio! Ho un sacco di testo come input (circa 20 GB di valore, non MASSIVE ma abbastanza grande). Questo è solo testo libero, non strutturato. Ho un 'elenco di categorie'. Voglio elaborar...
posta 05.07.2013 - 18:54
0
risposte

Best practice per dashboard di analisi quasi in tempo reale

Attualmente sto costruendo un dashboard per visualizzare alcune analisi dei dati generati dal prodotto della mia azienda. Usiamo MySQL come nostro database. Le query SQL per generare le analisi dai dati live grezzi possono essere un po 'complica...
posta 04.02.2016 - 06:44
1
risposta

Il modo migliore per implementare una dashboard dai dati in HDFS / Hadoop [chiuso]

Abbiamo una serie di dati (diversi TB) in Hadoop HDFS ed è in crescita. Vogliamo creare una dashboard che riporta i contenuti in essa contenuti, ad esempio conteggi di diversi tipi di oggetti, tendenze nel tempo ecc. Il nostro primo pensiero...
posta 10.10.2013 - 15:24