Sto lavorando con feed di dati da siti affiliati. L'idea di base è quella di fornire un'interfaccia in cui l'utente può incollare un collegamento a un flusso di dati XML (questi sono enormi btw, circa 60 mb) che sarebbero poi trasmessi in streaming, analizzati in piccoli blocchi e estratti per i dati richiesti che sarebbero poi memorizzato nel database.
Il problema è che diversi siti affiliati hanno Schemi diversi per i loro XML. È un po 'difficile mappare gli elementi in un XML agli attributi del database quando non si conosce realmente quale elemento contiene cosa.
La mia soluzione: utilizzare XPath per attraversare il primo insieme di parent e discendenti, recuperare gli elementi come pure i dati e chiedere all'utente di associare questi dati agli attributi nel database selezionando da un set di radio pulsanti che rappresentano gli attributi dal database. Questo sarà fatto solo una volta per ogni nuovo Feed, una volta che il sistema saprà che cosa caricherà automaticamente i dati dall'XML al database.
Questo suono è fattibile? C'è una soluzione migliore? Mi rendo conto che questo lascia un'apertura scomoda per l'errore umano ..
Grazie.