Recentemente, mi sono imbattuto in sempre più postazioni che utilizzano i file PDF come formato non modificabile per garantire che i dati in esso contenuti non vengano alterati in alcuna forma. (Che questa sia una buona idea o no è un'altra domanda - il pubblico in generale "capisce" il PDF e sa come generarlo facilmente dai sistemi.)
Tuttavia, quello che sto avendo problemi è costringerlo in un formato testuale e parsimonioso che consente l'analisi dei dati nel PDF. pdftotext
fa molto, ma c'è quasi sempre un piccolo problema con il suo output che lo rende una soluzione non ideale.
Ci sono soluzioni a questo dilemma? Che cos'è un formato di file di testo che può essere ragionevolmente assicurato essere l'output originale di alcuni software (senza passare attraverso i cerchi di firme e crittografia) che un laico sarebbe in grado di aprire e leggere facilmente?
Nota : sono ben consapevole del fatto che tutti i formati sono modificabili, ma non è così evidente per l'utente medio cioè probabilmente non saprebbero come modificare un PDF senza alcuna ricerca. Inoltre, non sto sostenendo per questo, sono solo curioso di sapere se esiste un formato più amichevole. Non riuscirò a convincere un sacco di persone a capire quali sono le firme dei file, figuriamoci a generarle correttamente.