Dopo un po 'di ricerca sembra che lo strumento che stai usando per investigare questo documento PDF sia uno strumento standalone python (?) scritto da un "ricercatore della sicurezza". Inserisco quel titolo tra virgolette semplicemente perché non so nulla di lui, a parte il fatto che lui afferma di essere un ricercatore della sicurezza e gli piace mettere il suo nome sul suo sito web.
Forse qualcuno che è più un esperto di PDF può venire e dare alcune informazioni migliori, ma da quello che ho visto finora non sembra che il suo strumento sia in realtà molto utile per cercare di decidere se un particolare file PDF contiene javascript dannoso. Considerando che entrambi javascript e azioni fanno parte dello standard Adobe per i file PDF, sembra assurdo pensare che solo perché un file PDF contiene javascript / azioni che potrebbero essere dannoso. Lui non lo afferma, ma dichiara il qualificatore molto inutile che "ogni file PDF dannoso che ho visto contiene javascript / azioni". Ecco un'affermazione altrettanto vera: "Ogni sito malevolo che ho visto contiene javascript". Devo quindi disabilitare javascript nel mio browser o evitare le pagine con javascript? Ovviamente no. Dal mio punto di vista, il problema più grande che vedo è una ricerca che forse non comprende la differenza tra correlazione e causalità.
Detto questo, è possibile che questo documento contenga JavaScript javascript. Il modo migliore per scoprirlo sarebbe cercare di estrarre il javascript in questione e vedere cosa effettivamente fa senza eseguirlo. Poiché lo strumento in questione sta già analizzando un file PDF, potrebbe essere possibile ottenere tali informazioni da tale strumento. Quindi potresti dover trovare un altro strumento o provarlo tu stesso.
Se nessuna di queste opzioni ti interessa, proverei a considerarla come un'analisi di rischio / beneficio:
- Hai qualche motivo per diffidare di questo file PDF?
- Proviene da una fonte attendibile?
Se proviene da una fonte attendibile e non hai motivo di diffidare, probabilmente lo aprirò. Se sei preoccupato, puoi sempre provare ad aprirlo in una macchina virtuale o trovare un lettore PDF che non elabori javascript. Puoi anche provare a trovare un modo per rimuovere qualsiasi javascript dal PDF prima di visualizzarlo. Immagino che questo è ciò che pdfid -d
dovrebbe fare, ma considerando che non so nulla dello strumento che sarebbe qualcosa di meglio diretto all'autore.
Se sei su Linux qualcosa di semplice:
pdf2ps input.pdf - | ps2pdf - output.pdf
potrebbe funzionare. Questo lo convertirà da pdf a ps e di nuovo in pdf. Fondamentalmente, stampa il file, che (credo) rimuoverà tutte le meta informazioni. Immagino che pdf2ps non abbia una libreria javascript integrata, quindi penso che sia sicuro assumere che qualsiasi javascript dannoso verrà rimosso in modo sicuro in questo processo.
Poi di nuovo, tutto questo è una risposta "dalla cima della mia testa", quindi la tua migliore scommessa è quella di porre un'altra domanda su come rimuovere in modo sicuro javascript da un file PDF. Sono sicuro che è una domanda molto più concreta (e facilmente risolvibile) quindi "Come sapere se un file PDF è infetto?".