Sto lavorando su un cluster hadoop che deve implementare una qualche forma di governance dei dati (per i miei scopi, diciamo solo lignaggio / provenienza dei dati per tracciare la cronologia dei file nell'HDFS). Questo cluster utilizza l'implementazione hadoop di MapR e come tale è incompatibile ( link ) con il opensource data gov. strumento apache atlante ( link ). Esistono alternative opensource valide per MapR o altri cluster che non sono in grado di utilizzare l'atlante per qualsiasi motivo? Qualsiasi progetto di sistema convenzionale / di best practice che può essere implementato automaticamente per tenere traccia dei lignaggi dei file? Grazie.