Questa potrebbe non essere un'opinione popolare (cue comments) , ma Non sono un fan del Machine Learning utilizzato nel settore della sicurezza .
Sono sempre scettico quando sembra che l'approccio sia "Non sappiamo come risolvere questo problema, lo so, lanciamolo contro ML !!". Ovviamente ci sono nicchie all'interno della sicurezza in cui la ML sembra andare per il verso giusto, ad esempio rilevando malware e frodi finanziarie, ma anche lì, viene utilizzata con cautela.
Ricorda che ML fa parte del campo della statistica: la scienza di rilevare il comportamento del caso medio. In ML ti preoccupi di distinguere il cane medio dal gatto medio e non preoccuparti del 5% che si sbaglia. Nel frattempo, la sicurezza è il campo di rilevamento del comportamento contraddittorio nel caso peggiore. In sicurezza, il tuo sistema deve continuare a essere strong anche se l'hacker può eseguirne il reverse engineering e fornire l'input del caso peggiore.
Considera ora il documento: " SPIEGARE E RAFFORZARE ESEMPI DI ESPLORAZIONE " di Goodfellow, Shlens e Szegedy:
Several machine learning models, including neural networks, consistently misclassify
adversarial examples—inputs formed by applying small but intentionally
worst-case perturbations to examples from the dataset, such that the perturbed input
results in the model outputting an incorrect answer with high confidence.
Ecco l'immagine principale di quel documento:
Seècosìfacile"hackerare" un classificatore di immagini (probabilmente il sottocampo di ML meglio studiato), allora cosa ti fa pensare che puoi creare un filtro WAF basato su ML che funzioni meglio contro gli hacker in contraddizione?
TL; DR : questo è stato il mio rant che ML non dovrebbe avere un posto in sicurezza a meno che non sia gente che veramente veramente sa cosa sta facendo.