Ho un'applicazione che richiede la funzionalità di convertire i documenti PDF in documenti di testo e quindi li analizza per recuperare le informazioni. Sto usando il xpdf programma di utilità pdftotext
per raggiungere questo obiettivo.
Sono molto preoccupato per gli attacchi sul mio server a causa delle vulnerabilità nei documenti PDF, come backdoor access nei PDF caricati, o altri difetti di sicurezza che vengono con esso come incorporare alcuni comandi che possono ferirci, come le password di forza bruta sul mio database ecc.
Possibili soluzioni:
Strumenti come PDFiD che è suggerito qui sulla risposta SE. Ma sono abbastanza obsoleti e sono molto nervoso nell'usare queste soluzioni.
Esecuzione del comando pdftotext
come utente diverso che ha i privilegi minimi sulla macchina, in modo che non sia in grado di visualizzare o modificare qualcosa che non possiede e non è in grado di emettere sudo
o su
comandi.
Sto cercando idee su come proteggermi da tali potenziali attacchi.