In che modo i server Web gestiscono i problemi che si presentano quando una macchina è attiva da molto tempo?

0

Sembra essere accettato che i computer che sono stati accesi per un lungo periodo e che abbiano un qualsiasi tipo di software complesso (ie OS) in esecuzione su di essi tendono a sviluppare errori e problemi casuali. Spegnere e riaccendere il dispositivo spegne la macchina e distrugge tutta la memoria volatile, risolvendo generalmente il problema.

In primo luogo, sto solo immaginando che o è accettato? C'è una descrizione migliore o una parola / frase per questo?

In secondo luogo, come si comportano i server con questo. Sono generalmente macchine 24/7/365. Anche se più macchine che servono la stessa pagina potrebbero essere disattivate singolarmente, si fa in quella situazione?

    
posta KDecker 29.09.2014 - 00:43
fonte

3 risposte

2

Potrebbe essere la norma accettata se sei abituato a gestire hardware e software che non sono così stabili. Ma non ho osservato una particolare tendenza dei server che funzionano male dopo prolungati periodi di attività nella mia carriera. Ho eseguito molti server Solaris, Linux o BSD ben oltre i 1000 ore di operatività e più di una manciata hanno raggiunto il limite di 1400-1500 giorni. Aggiornerei Apache o applicherò altre patch senza applicare patch al kernel e continuerò a fare il trucking. (NOTA: Non sostengo che ciò sia una pratica di sys-admin, ma ci sono sistemi che i clienti non vogliono riavviare a meno che non ci sia un problema).

Per quanto riguarda il modo in cui viene eseguito nei server Web che servono solo le pagine, sei corretto, una pagina può e viene spesso servita da server ridondanti e persino da una rete di distribuzione di contenuti. Abbattere un nodo non dovrebbe influire sul tuo sito se hai ridondanza e cache. L'alta disponibilità è tutta una questione di ridondanza. Non è così importante mantenere un singolo nodo in buone condizioni per ottenere runtime estesi per un sito Web statico. Non dovresti davvero avere bisogno di dipendere da un singolo server web oggi quando una VM Linux può essere caricata per $ 5 al mese su Digital Ocean e una configurazione Linux con carico bilanciato a 2 nodi può essere messa insieme a un prezzo conveniente.

Lo spostamento negli ultimi 10 anni è stato verso molti server economici. Nel periodo di tempo 1998-2000 presso IBM stavamo già gestendo massicce web farm con 50-100 nodi che servono un singolo sito (Olimpiadi, Wimbledon, US Open, Masters), e ora è un luogo comune da aziende come Google e Facebook pubblicato molta letteratura su questa tecnica.

    
risposta data 29.09.2014 - 03:43
fonte
0

Qualsiasi sistema che deve essere ripristinato / riavviato dopo un po 'per continuare a funzionare è difettoso. Diversi errori includono cose semplici come perdite di memoria a problemi più complessi come errori di progettazione.

Molti anni di software scadente hanno avuto l'effetto di "addestrare" gli utenti ad accettare sistemi difettosi; e per aggirare il problema riavviando. Nota: "risolvere un problema" non equivale a risolvere un problema.

Per i server (ad es. macchine 24/7/365) questo non è possibile e hai bisogno (ad es.) di software che non sia difettoso.

    
risposta data 29.09.2014 - 01:29
fonte
0

Beh, in primo luogo mi aspetterei anni di ininterrotta attività da qualsiasi sistema operativo server moderno (anche Windows :-)).

Ma di solito ci sono ragioni esterne per far cadere un server (spesso ogni pochi mesi!). Aggiornamenti software, aggiornamenti hardware, cambio filtri antipolvere, riorganizzazione del data center, applicazione di patch di sicurezza ecc.

Se il sistema è critico e dovrebbe funzionare 24 * 7 * 365, ci sono alcuni modi per risolvere questo problema.

  • Esegui un cluster con bilanciamento del carico. Ricalcola semplicemente i server uno alla volta.
  • Avere un hot standby. Passa il carico al computer in standby quando si applica la manutenzione.
  • Nessun server reale - esegue solo macchine virtuali. È possibile spostare l'immagine su un altro server fisico in modo rapido, riducendo al minimo i tempi di inattività.

In pratica, una configurazione robusta utilizzerà probabilmente un ibrido di tutti i metodi precedenti. Un cluster di server fisici, che esegue una serie di immagini di macchine virtuali con bilanciamento del carico, con alcuni server hot standby in un sito remoto.

    
risposta data 29.09.2014 - 04:03
fonte

Leggi altre domande sui tag