Domande con tag 'big-data'

1
risposta

Ricerca di grandi quantità di dati per l'elaborazione parallela [chiusa]

Ho un set di dati contenente un elenco di utenti (circa 50 milioni). Ogni utente ha un indirizzo email, un nome e altre colonne di dati. Voglio inviare un'email settimanale a quegli utenti e il contenuto dell'email sarà basato sui dati dell'ut...
posta 30.11.2015 - 12:27
3
risposte

Big Data: può essere pre-elaborato?

La mia domanda riguarda i "big data". Fondamentalmente, i big data implicano l'analisi di una grande quantità di dati per ricavarne approfondimenti significativi. Vorrei sapere: Indipendentemente dal fatto che grandi quantità di dati possa...
posta 24.02.2014 - 16:46
5
risposte

Framework di applicazioni Web e database consigliati per Enterprise, app "Big-Data"?

Ho un'applicazione web che ho sviluppato per un piccolo gruppo all'interno della mia azienda negli ultimi anni, utilizzando Pipeline Pilot (oltre a jQuery e Python scripting) per lo sviluppo web e il calcolo back-end, e Oracle 10g per il mio RDB...
posta 02.04.2013 - 17:34
4
risposte

Approcci per la memorizzazione e l'analisi di grandi quantità di dati basati sul tempo

Mi è stato chiesto di sviluppare un'applicazione di "telemetria" che registra i dati generati da un dispositivo hardware, che leggo ogni 100 ms. Ci sono circa 250 punti dati (valori a 32 bit), ma solo un sottoinsieme di questi (ad esempio 30-...
posta 02.07.2015 - 15:41
1
risposta

In che modo Google memorizza le tendenze di ricerca nel back-end?

Le tendenze di Google mostrano quale query è stata cercata quante volte e altre proprietà della suddetta query. Ma come vengono memorizzati questi dati in un database? Memorizzare una nuova riga per ogni ricerca non sembra corretta. Dicono an...
posta 21.10.2012 - 21:03
1
risposta

Come è implementata una o più funzioni di aggregazione nella maggior parte dei motori SQL?

Nel libro Database Fundamentals, Silberschatz. Si spiega che le funzioni aggregate possono essere calcolate durante la marcia. Questo ha senso. Ciò che significa è che per calcolare il massimo, calcolare la media o contare gli elementi di un...
posta 04.04.2016 - 22:44
1
risposta

L'apprendimento automatico fa parte di Data Science?

Ho problemi a distinguere tra Big Data e Data Science. Da quello che ho capito finora, entrambi sono parole d'ordine per il vecchio lavoro di statistica. Dove si inserisce l'apprendimento automatico in questo?     
posta 28.11.2016 - 06:14
3
risposte

Database relazionale vs Graph per reti (inizialmente) di dimensioni moderate

Stiamo sviluppando un'applicazione il cui dominio dei dati (o almeno il 90% di esso) può essere modellato efficacemente utilizzando un database relazionale. Abbiamo usato PostgreSQL sin dall'inizio e non ho avuto alcun problema. Tuttavia, ora...
posta 03.02.2016 - 18:53
1
risposta

Strumenti per operare su grandi quantità di dati di testo

Devo gestire ed elaborare circa 5 milioni di articoli di notizie, una quantità abbastanza piccola da adattarsi a un desktop di materie prime, ma troppo grande per essere processata in serie. Finora, ho usato Python / pickle per la serializz...
posta 18.04.2012 - 04:41
0
risposte

Best practice per dashboard di analisi quasi in tempo reale

Attualmente sto costruendo un dashboard per visualizzare alcune analisi dei dati generati dal prodotto della mia azienda. Usiamo MySQL come nostro database. Le query SQL per generare le analisi dai dati live grezzi possono essere un po 'complica...
posta 04.02.2016 - 06:44