Supponiamo che ci sia un incidente che richiede una risposta immediata, come un'epidemia di virus via e-mail, Cryptolocker che crittografa attivamente i file o un attacco DOS.
Come dovrei approcciarlo in un modo che non solo sarebbe valutato in termini di clienti (SLA, ecc.), ma sarebbe anche visualizzato positivamente da tutti i livelli di management e dai miei colleghi?
Suppongo che ci siano le seguenti fasi:
- Identificazione
- Il contenimento
- Soluzione
A volte un incidente ci impone di andare indietro e ri-identificare il problema, (ad esempio, non è un problema del server web, è un attacco DOS), e spesso un tecnico ben intenzionato lavorerà su attività che si sovrappongono e potrebbero non aiutare la situazione, o peggio, potrebbero ostacolare altri problemi. (ad esempio, un ripristino SAN sullo stesso LUN della produzione, prestazioni di abbattimento)
Domanda
Dal momento che ci sono spesso molte parti mobili per risolvere i problemi, quale processo posso considerare come guida per dare al processo di contenimento e riparazione più struttura?
Alcune cose che posso pensare includono:
- Identifica gli utenti interessati, gli stakeholder aziendali
- Identifica le persone, i fornitori che stanno lavorando alla soluzione
- Comunicare le attività e lo stato di tutte le attività tra persone e venditori che lavorano alla soluzione
- Condividi lo stato appropriato del pubblico (helpdesk, gestione, executive)
Ci dovrebbe essere una sorta di guida che ha già scritto che risolve questo problema, ad es. in un "runbook" di sorta, ma non sono sicuro di come si chiamerebbe. I termini di ricerca sarebbero apprezzati