Qual è il formato di un file che è facile da usare e adatto al testo ma non molto modificabile?

1

Recentemente, mi sono imbattuto in sempre più postazioni che utilizzano i file PDF come formato non modificabile per garantire che i dati in esso contenuti non vengano alterati in alcuna forma. (Che questa sia una buona idea o no è un'altra domanda - il pubblico in generale "capisce" il PDF e sa come generarlo facilmente dai sistemi.)

Tuttavia, quello che sto avendo problemi è costringerlo in un formato testuale e parsimonioso che consente l'analisi dei dati nel PDF. pdftotext fa molto, ma c'è quasi sempre un piccolo problema con il suo output che lo rende una soluzione non ideale.

Ci sono soluzioni a questo dilemma? Che cos'è un formato di file di testo che può essere ragionevolmente assicurato essere l'output originale di alcuni software (senza passare attraverso i cerchi di firme e crittografia) che un laico sarebbe in grado di aprire e leggere facilmente?

Nota : sono ben consapevole del fatto che tutti i formati sono modificabili, ma non è così evidente per l'utente medio cioè probabilmente non saprebbero come modificare un PDF senza alcuna ricerca. Inoltre, non sto sostenendo per questo, sono solo curioso di sapere se esiste un formato più amichevole. Non riuscirò a convincere un sacco di persone a capire quali sono le firme dei file, figuriamoci a generarle correttamente.

    
posta Alex Koay 16.09.2017 - 04:29
fonte

1 risposta

2

Non esiste un formato file che possa impedire la modifica. Può solo rendere più difficile apportare modifiche perché scrivere un editor è troppo complesso. Questo era il caso del PDF, ma ora ci sono già abbastanza editor per PDF. Pertanto, per evitare modifiche facili, è necessario un formato complesso e difficile da capire, esattamente ciò che non si desidera. Se hai un formato semplice, sarà anche facile scrivere editor per esso.

Invece di accertarsi che sia troppo difficile modificare i dati, è meglio trovare un modo per rilevare tali modifiche. Separando il contenuto dalla protezione è possibile creare un formato che sia facile da leggere e difficile da manipolare inosservato.

Un modo comune per farlo è usare le firme digitali. Qualsiasi firma incorporata nel file può essere semplicemente ignorata da un lettore umano o elaborata da uno script. E tali firme possono anche essere separate in file separati, il che rende possibile aggiungere firme a qualsiasi formato di file.

A seconda dei requisiti di protezione e usabilità nella creazione del documento, è possibile utilizzare diverse qualità delle firme. Nel caso più semplice, la firma potrebbe essere semplicemente un HMAC con la chiave segreta necessaria incorporata nell'applicazione che crea i file. In questo caso questa applicazione deve essere segreta o la chiave in qualche modo protetta dal reverse engineering. Una protezione migliore è offerta dalle chiavi specifiche dell'autore, dall'uso di smart card ecc. Ma potrebbe essere troppo complesso per il tuo solo caso d'uso definito vago.

    
risposta data 16.09.2017 - 06:50
fonte

Leggi altre domande sui tag