ISO 27001 e indagando sui problemi di produzione

1

Ogni tanto riscontriamo problemi sui sistemi di produzione, la maggior parte dei quali non può essere replicata su dev / systest / uat per i seguenti motivi,

  • Non abbiamo dati sufficienti su dev / systest / uat ad es. la produzione ha milioni di righe ... ma il nostro altro ambiente ne ha poche migliaia

  • Non abbiamo strutture dati corrette, profondità di dati ecc ...

Come sviluppatore mi era stato detto che gli sviluppatori accreditati ISO 27001 non possono toccare la produzione anche solo per indagini, ad es. Lettura dei dati e non scrittura.

Personalmente non ho problemi con questo ... ma rende i problemi investigativi come un incubo, dobbiamo fare un salto infrastruttura e supporto tutto il giorno. Qualcosa che possiamo testare in poche ore richiede giorni.

È così che voleva essere?

    
posta Mathematics 05.02.2018 - 10:29
fonte

2 risposte

3

In passato ho affrontato molti di questi problemi e hai ragione, è un incubo. Ti suggerisco di iniziare mettendo te stesso saldamente dalla parte delle migliori pratiche e dicendo "Prendi una copia di live, per quanto allettante - NON è un'opzione". Ti mette nel giusto spazio sin dall'inizio, per i miei motivi per cui vedi una mia precedente risposta .

Ottenere un buon ambiente di test è fondamentale, spesso si evolve insieme agli ambienti di produzione e aiuta a testare i percorsi di aggiornamento e i bug regolari. Mettendo il tempo qui e assicurandoti di avere una squadra e una strategia per il controllo della qualità, pagheresti i dividendi su tutta la linea.

Detto questo, questa è la vita reale e ci sono sempre problemi che vengono scoperti solo dal vivo. Quindi, come mai puoi indagare su un problema che si sta verificando su un sistema, per un cliente, e da nessun'altra parte?

La chiave è in registrazione.

Hai il codice e hai i log. Quello che devi fare è un processo di eliminazione per capire cosa sta succedendo nelle varie fasi.

Ma cosa succede se i registri e i dati che ti servono non esistono?

Quindi sei un passo avanti, capire che cosa è necessario per risolvere il problema è il primo passo sulla strada per risolverlo. Identifica le domande che hai (il codice ha inserito questa istruzione IF o lo salta) e lo dimostra.

Questo è molto più facile a dirsi che a farsi, quindi ho detto che qui ci sono alcuni suggerimenti:

  • I tuoi progressi su questi temi sono ora inesorabilmente collegati ai tuoi piani di rilascio, il rapido sviluppo e la rapida implementazione giocano un ruolo più che mai.
  • Ottieni le persone che scrivono il codice risolvendo i problemi, altrimenti avrai una squadra che canta i valori di una buona registrazione e un'altra che li ignora
  • NON registrare MAI qualcosa di sensibile / inappropriato nei log non sicuri
  • Mantieni la tua comunicazione aperta, un cliente è molto più reattivo se conosce il piano, capisce cosa c'è nel rilascio e quando lo prenderà
  • Gli sviluppatori che vengono rimossi dai sistemi live non significa necessariamente che non possono porre domande, si consiglia di chiedere loro di accoppiarsi con i ragazzi dell'Ops che fanno domande, ma tenendo le mani lontane dal keyboad
  • Considerare seriamente di lasciare il log in atto, se ti ha punzecchiato una volta, quindi conservare le risorse diagnostiche lì renderà molto più facile risolverlo.

La chiave per risolvere questo problema è avere un buon processo di controllo qualità e frequenti cadute incrementali in produzione (che possono aiutarti a indagare sui problemi man mano che procedi). È divertente, questa è la soluzione a molti problemi di sviluppo del software!

    
risposta data 05.02.2018 - 12:55
fonte
0

Per il nostro onlineshop abbiamo il debug-logging basato sulla sessione.

Di solito vengono registrate solo le informazioni importanti (per la maggior parte sono registrati log level warnig, errror e fatal)

Esiste un parametro shop-url che abilita la registrazione estesa per una sessione Web in modo che il registro ottenga informazioni aggiuntive, traccia, esegua il debug dei messaggi per l'affidabilità di quel cliente che possiede la sessione.

Purtroppo questo funziona solo per errori riproducibili e devi chiedere al cliente di farlo di nuovo con il parametro url.

    
risposta data 05.02.2018 - 16:56
fonte

Leggi altre domande sui tag