Sto lavorando su uno script per ottenere dati da fogli di calcolo Excel in un database. I dati provengono da sondaggi condotti dal nostro ufficio in cui i dati arrivano con pochissima formattazione. Al momento, i dati vengono manipolati con un sacco di copia e incolla, quindi analizzati 'a mano' (cioè qualcuno fa clic e trascina in Excel e fa pivot e copia le paste in altri software). Questo porta a strutture di file disordinate e mancanti o dati errati / incomprensibili. inserisci la necessità di un database.
Ho una soluzione funzionante che accetterà i file CSV. Analizzerà i dati e li inserirà correttamente purché ogni intestazione di colonna sia corretta. Ma il mio superiore mi sta spingendo ad accettare file xml con uno schema xsd in modo da poter convalidare i dati.
Il mio argomento sarebbe che userò o meno xml, l'utente dovrà salvare il file originale come un altro tipo di file e posso comunque convalidare i dati all'interno del mio script basandomi sugli header delle colonne.
L'argomento del contatore è che se decidono di includere un nuovo set di dati (cioè un nuovo layout di tabella) il mio script potrebbe interrompersi.
In entrambi i casi, se il tipo di dati non è corretto, l'utente dovrà tornare al file e modificarlo prima che qualsiasi soluzione possa funzionare. Quindi la risposta che sto cercando è se dovrei preoccuparmi di impostare la funzionalità xml.
[nota, sto usando php per scrivere perché non ho familiarità con vba e sono su un collocamento di studenti, quindi non ho abbastanza tempo per imparare una nuova lingua.] [A parte: sto prendendo l'approccio strizzacervelli a questo?]