Dove devo archiviare i metadati dello stream wide nell'elaborazione dello stream?

0

Sto costruendo un'architettura di elaborazione del flusso e mi chiedevo cosa fare con i metadati relativi allo stream. Ad esempio, ogni messaggio di dati proveniente da una fonte ha la stessa attribuzione, dal momento che passa dalla fonte all'elaborazione, arricchendo e infine a un sink che i dati di attribuzione non cambiano ma sono rilevanti per ogni messaggio.

Sto pensando di usare Apache Kafka per la coda dei messaggi, solo per riferimento.

Che cosa faccio con questi metadati? Memorizzo l'attribuzione completa in un database e trasferisco semplicemente l'id di quella voce del database in ogni messaggio? O è meglio mettere effettivamente l'attribuzione in ogni singolo messaggio mentre viene passato lungo la coda dei messaggi? O c'è un'opzione migliore o più standard?

    
posta binarylegit 25.10.2016 - 17:20
fonte

1 risposta

0

Se i metadati sono utilizzati nell'elaborazione di un messaggio, allora dovrebbe far parte di quel messaggio. Ciò impedisce che dati e metadati non siano sincronizzati, compresi i metadati mancanti.

Se i metadati non vengono utilizzati, c'è una buona ragione per trattenerli?

    
risposta data 25.10.2016 - 18:56
fonte