Supponendo l'esistenza di un numero sufficiente di input benigni?

1

Mi sono imbattuto in diverse soluzioni di sicurezza basate sull'apprendimento automatico che addestrano i loro rivelatori / modelli usando input "benigni". L'ipotesi è che l'operatore abbia accesso a ingressi benigni sufficientemente esaustivi (ingressi benigni che forniscono un input e una copertura di codice sufficienti per l'utilizzo tipico).

È un'ipotesi realistica nella pratica? Ci sono modi per generare automaticamente input così benigni? O è un'infanzia accademica?

    
posta John 28.11.2015 - 00:07
fonte

2 risposte

1

Is that a realistic assumption in practice? Are there ways to automatically generate such benign inputs? Or is that an academic infancy?

Che altamente dipende dal tipo di dati di input che stai cercando di simulare. Quindi la risposta breve è: solo chi ha familiarità con il tuo dominio può decidere che.

Ecco cosa intendo: se gli "input positivi" che stai tentando di simulare sono dati utente realistici da Google Location Services o il tipico comportamento di navigazione su Amazon.com, allora sì, la capacità di simulare tali input è "in la sua infanzia accademica ".

D'altra parte, se stai provando a eseguire il test di un'applicazione che accetta un protocollo standardizzato, ad esempio il certificato Protocollo di gestione (CMP) - che ha un numero molto limitato di tipi di messaggi accettati (~ 30 per CMP), quindi no, in realtà è abbastanza facile generare un set completo ed esauriente di input di esempio.

Quindi cosa stai cercando di fare? Che tipo di dati di input stai cercando di simulare? Se modifica la tua domanda per fornire maggiori dettagli, possiamo darti una risposta migliore.

    
risposta data 28.11.2015 - 02:22
fonte
0

È realistico supporre che i tuoi clienti forniranno abbastanza traffico per addestrare correttamente il tuo rilevatore euristico? Questo dipende dall'implementazione.

La tua attività potrebbe essere ciclica. Potresti avere vendite impegnate per un periodo di ferie e poi fare le scorte il mese successivo. Se non si allena il sistema con i dati di vendita e di inventario, potrebbe falsamente identificare il traffico di inventario come ostile. Ma dal momento che è il tuo business, tu devi conoscere quei cicli e tenerne conto. Nessun sistema euristico può prevedere come funziona la tua attività o quale tipo di traffico la tua azienda considererebbe "normale".

Così come non sono in grado di riconoscere il traffico normalmente, i loro sistemi non sono ugualmente in grado di generare il traffico "benigno". Ecco perché ti viene chiesto di fornire esplicitamente i tuoi esempi.

    
risposta data 28.11.2015 - 01:46
fonte

Leggi altre domande sui tag