Ho un file PDF che, quando si passa tramite "Proprietà", non mostra alcun dato, ad esempio nessuna menzione dell'autore del file. è in ogni modo che posso sbloccare tali informazioni.
Purtroppo, popolare metas è assolutamente una buona pratica , ma non un requisito.
Potresti creare un PDF da circa ogni programma in grado di stampare qualcosa, quindi ci sono tanti creatore di PDF diversi dalle applicazioni.
Ma potresti dividere ( sorgente ) il tuo PDF, (con pdftk , ghostscript , pdfdetach e molti altri strumenti) quindi ispezionare ciascun componente.
Questo potrebbe diventare un lavoro forense, ma potresti determinare un sacco di cose con questo tipo di lavoro.
printf "%%1\n/Helvetica findfont\n11 scalefont\nsetfont\nnewpath\n
300 500 moveto\n(%s) show\nshowpage\n" TEST |
gs -sDEVICE=pdfwrite -sOutputFile=/tmp/test.pdf - -c quit
Questo produrrà un normale file PDF , contenente solo la parola TEST
...
pdfinfo /tmp/test.pdf
Producer: GPL Ghostscript 9.20
CreationDate: Fri Dec 8 17:46:00 2017 CET
ModDate: Fri Dec 8 17:46:00 2017 CET
Tagged: no
UserProperties: no
Suspects: no
Form: none
JavaScript: no
Pages: 1
Encrypted: no
Page size: 595 x 842 pts (A4)
Page rot: 0
File size: 2569 bytes
Optimized: no
PDF version: 1.5
Bene, se desideri vedere i metadati del file .pdf
, come Autore, Data di creazione, Data di modifica, Dimensione, IDMacro del libro, ecc.
Puoi utilizzare pdftk . Se non conosci lo strumento pdftk, Ecco una riga dal suo manuale
If PDF is electronic paper, then pdftk is an electronic staple-remover, hole-punch, binder, secret-decoder-ring, and X-Ray-glasses. Pdftk is a simple tool for doing everyday things with PDF documents.
Venendo alla tua domanda, pdftk supporta anche i dump di dati. Quindi, ecco la tua risposta.
Installa pdftk
(Se non installato):
sudo apt-get install pdftk
Quindi esegui il comando:
pdftk "pdf_file_to_investigate" dump_data
Mostrerà i dati sotto forma di InfoKey & InfoValue dove Infokey
memorizza il tipo di Informazioni e Infovalue
memorizza le informazioni stesse.
Ho bisogno di fare due punti qui:
I. Il comando invia informazioni a STDOUT. Quindi, se le informazioni sono troppe, sarai fuori dallo schermo sul terminale. Un modo migliore sarebbe quello di salvare il contenuto e in seguito guardarlo usando il comando cat
. Per fare questo puoi:
pdftk "pdf_file_to_investigate" dump_data > "pdfinfo_file_name.txt"
cat "pdfinfo_file_name.txt" | more
II. È possibile aggiungere utf8 alla fine di data_dump se non funziona correttamente. È solo lo schema di codifica dell'output e IS saggia da usare. Per fare questo puoi:
pdftk "pdf_file_to_investigate" dump_data_utf8 > "pdfinfo_file_name.txt"
A seconda del PDF puoi andare più in profondità, come ad esempio il pdf contiene i file di immagine scansionati, puoi controllarlo usando software forense a pagamento per vedere se i pixel sono stati alterati sull'immagine o potenzialmente identificare il modello Scanner / Copiatrice usato per generalo.
Leggi altre domande sui tag pdf