Cosa occorrerebbe per eseguire la scansione di un PDF per contenuti discutibili oltre al malware?

2

La mia azienda sta cercando di implementare una nuova funzione sul nostro sito per consentire ai clienti di caricare i documenti che accompagnano un ordine. Sappiamo che avremo bisogno di eseguire una sorta di scansione del malware chiamando un servizio. Tuttavia, il mio capo ha anche chiesto che la scansione venga eseguita per contenuti discutibili che potrebbero finire sui nostri server se non vengono catturati. I file in questione sarebbero in formato PDF. Il mio istinto mi dice che questo è un aumento significativo della complessità, in quanto il sistema dovrebbe decifrare il contenuto di ciascun file PDF. C'è qualcosa là fuori che fa questo oggi, e cosa farebbe il sistema per raggiungere questo obiettivo?

    
posta Alice 28.06.2016 - 16:32
fonte

2 risposte

1

Ci sono alcuni quadri che vengono in mente per questo. Mastino , Viper , e IRMA . Tutti sono pensati per il reverse engineering e l'analisi del malware, quindi è necessario eseguire alcune personalizzazioni. Ad esempio:

Installazione immediata:

client  --> uploads file to system
system  --> system sends it to one of the above
program --> analyzes file creates report

Dovresti fare qualcosa di simile al seguente:

client  --> uploads file to system
system  --> system sends it to one of the above
program --> analyzes file if malicious delete/quarantine/etc
program --> analyzes file is not malicious send file to your org

Questo può essere fatto con un po 'di lavoro altrimenti questa diventa una domanda specifica del "venditore": "Che prodotto può ..." che è fuori tema qui.

    
risposta data 28.06.2016 - 17:00
fonte
1

Il problema è definire cosa sia "contenuto discutibile". Le tre possibilità che ti vengono in mente sono

  • di malware
  • materiale protetto da copyright che viene distribuito senza licenza,
  • contenuto ritenuto offensivo come calunnia / blasfemia / pensiero critico / pornografia ....

Il primo può essere massicciamente mitigato da appiattimento del PDF file e scansione antivirus per buona misura.

Affrontare il secondo è anche relativamente facile - basta costruire un database di tutti i contenuti protetti da copyright nel mondo e vedere se qualcosa nel PDF lo combacia. Hai ancora bisogno di un proces manuale per "fair use".

Il terzo è un po 'complicato.

    
risposta data 28.06.2016 - 17:40
fonte

Leggi altre domande sui tag