Perché 5 diversi iMac hanno sviluppato partizioni OS X corrotte quando le unità fisiche stanno bene?

9

Sono un tecnico del mio distretto scolastico locale e stiamo riscontrando alcuni problemi con il nostro iMac Multimedia Lab. Negli ultimi nove mesi, 5 dei 22 iMac hanno sofferto della corruzione del filesystem. L'unica risorsa per queste macchine è stata quella di cancellare completamente la partizione di OS X e avviarne di nuovi (con il ripristino appropriato da Time Machine.)

Ecco l'elenco dei motivi per cui so che si tratta della corruzione del file system:

  • L'iMac non avvierà l'OS X. L'ho visto fermarsi al "throbber", alla barra di avanzamento o solo al logo Apple.

  • Il montaggio del disco iMac tramite la Modalità disco di destinazione (ad esempio quella funzione) ha esito positivo, ma solo per la partizione Bootcamp. La partizione OS X non riesce a montare.

  • Una verifica del disco rivela che la partizione di OS X deve essere riparata (ho visto voci di fratello non valido, bambini orfani, ecc.). Il tentativo di riparare il disco non riesce. Questo ultimo tentativo (solo ieri) ha detto che il catalogo B alberi non può essere ricostruito. Avrei dovuto fare delle note più complete su ciò che veniva detto ogni volta, ma ogni volta fino a quest'ultimo pensavo che fosse uno strano tipo di evento da un milione. Un colpo di fortuna

  • Anche il tentativo di riparare o ricostruire le unità con Drive Genius 3 non riesce Finora il 98% dei file dell'utente è stato recuperato tramite Data Rescue 3 Il disco rigido fisico non sembra essere in errore (il recupero dei file dall'unità non si blocca o "beachball", l'unità non appare e scompare in Utility Disco, il Finder rimane reattivo, ecc.)

  • Normalmente lo assegnerei a una serie di cattive unità. È appena successo che sia lo sfortunato che ha acquistato una cattiva serie di iMac, giusto? Ecco dove le cose iniziano a diventare interessanti. Sottoscrivo a te l'elenco delle stranezze:

  • Le unità vengono verificate come valide tramite SMART

  • La RAM si verifica
  • Dopo aver eliminato e ricreato la partizione (e reinstallato OS X) tutti i problemi scompaiono.
  • La corruzione non è avvenuta nello stesso Mac due volte
  • Bootcamp è installato sulla stessa unità e funziona prima, dopo e durante il danneggiamento sul lato Mac.
  • La partizione Bootcamp non ha riscontrato questo problema su QUALUNQUE degli iMac

Inoltre, per escludere l'ovvio:

  • Non ci sono stati brownouts o surge

  • Dubitiamo seriamente di un virus, in quanto i malfunzionamenti compaiono ovunque contemporaneamente (due macchine sono andate giù allo stesso tempo circa un mese fa) a mesi di distanza. Inoltre, i documenti dell'utente vengono ripristinati dopo la riformattazione, quindi si potrebbe supporre che, se si trattasse di un programma dannoso, il Mac continuerebbe a non funzionare più e più volte.

  • Le macchine sono state in un'area climatizzata

  • Non è stato lo stesso utente interessato

  • A volte il problema si verifica dopo un arresto forzato inevitabile (che si verifica solo di rado. Queste macchine non vengono eccessivamente spente. Solo ciò che ci si aspetta da un Mac Lab che esegue multimediale cinque giorni alla settimana), altre volte è completamente out-of-the-blue

Il software utilizzato di frequente include:

  • iPhoto
  • iDVD
  • iMovie
  • Safari

Le macchine sono anche caricate con Parallels 5, che carica la partizione Bootcamp in una VM. Parallels è stato impostato tramite la procedura guidata standard, senza configurazione o hack stravaganti.

E, ultimo ma non meno importante, le specifiche:

  • iMac 10,1 (21,5 pollici)
  • Unità di riserva
  • OS X Snow Leopard (ultimi aggiornamenti)
  • Memoria di scorta
  • Unita alla nostra infrastruttura di Active Directory
  • File system HFS + (senza distinzione tra maiuscole e minuscole, predefinito per OS X Snow Leopard)
  • Nessun problema di unità fuori dall'ordinario. programmi. Drive Genius è stato caricato ieri pomeriggio (dopo il recupero dall'ultimo errore) per eseguire una verifica su tutti gli iMac, ma non è stato installato prima. Tutti i Mac, sia quelli che hanno fallito nel passato che quelli che non hanno mai fallito, sono passati a pieni voti.

TL; DR: la partizione OS X è stata danneggiata su cinque diversi iMac, ma le unità fisiche vanno bene. PERCHE '!?!?!

    
posta EightQuarterBit 17.03.2011 - 03:53
fonte

4 risposte

6

HFS Plus (HFS +) è un filesystem fragile e poco aggiornato. Se lo fai su Google, troverai molti rapporti sulla corruzione del filesystem.

Il riavvio senza smontaggio del filesystem è il modo migliore per corromperlo. Questo succede quando il Mac si blocca per qualche motivo (nel mio caso è la scheda video nvidia) o per mancanza di corrente.

Ecco alcuni suggerimenti, che IMHO dovrebbe ridurre le possibilità di danneggiamento del filesystem:

  1. Quando il sistema si blocca, prova a riavviarlo da ssh. quando il sottosistema grafico delle mie mac free è ancora accessibile tramite SSH - prova ad aprire la connessione ssh dalla rete e riavvialo. Puoi utilizzare Apple Remote Desktop (€ 62) per questa attività. Devi prima abilitare l'accesso ssh.

  2. Esegui diskutil verifyVolume / periodicamente. Sì, anche se HFS + è un filesystem registrato su giornale, è possibile la corruzione. Puoi utilizzare Apple Remote Desktop per eseguirlo su tutti i computer della classe contemporaneamente.

  3. Utilizza più volumi. L'utilizzo di più volumi dovrebbe ridurre le possibilità di danneggiamento. Dividere / da /Users/ dovrebbe rendere più facile il ripristino (o / o / Gli utenti saranno corrotti). Nota che probabilmente questo potrebbe complicare le cose con Bootcamp.

  4. Monta le partizioni con le opzioni, che riducono la scrittura. L'installazione di partizioni con l'opzione noatime dovrebbe ridurre la scrittura su di essa. Per impostazione predefinita, ogni volta che si accede a un file, la data e ora dell'accesso viene "toccata".

  5. Assicurati che non ci siano tentativi di montare la partizione HFS + da altri os. È possibile che qualcuno stia iniziando una distribuzione Linux da usb / dvd e montando / in rw modalità o giocando con le impostazioni del journal?

Spero che la mia risposta sia utile.

PS: la corruzione solitamente è graduale, non improvvisa. Esiste la possibilità che qualcosa di specifico stia causando questo, software o flusso di lavoro. La mia mente è in Parallels 5, ma dovrebbe corrompere il volume bootcamp, non quello MacOS. La ricerca nel loro KB non rivela nulla di utile.

PPS: è fragile perché non ha un sistema reale per correggere la corruzione all'interno di un file. Un giornale registra i trasferimenti e tenta di ricopiare i dati al fine di riportare il file system a uno stato coerente, ma se il file perso è di vitale importanza (come i dati della struttura del filesystem effettivo), allora non c'è ricorso. Infatti, poiché il file catalogo (che elenca tutte le informazioni logiche dei dati) è archiviato come un file, se in alcuni punti è corrotto l'intero filesystem è reso inutilizzabile dati inutili, o parzialmente spazzatura nel caso in cui sia corrotto e si verifica la riproduzione di una rivista che provoca la ristrutturazione del filesystem in un modo non coerente con i dati (ad esempio, i file aeb sono rispettivamente 1MB e 2MB, ma la riproduzione li modifica in 2MB e 1MB risultando nella metà del contenuto di B che si trova all'interno di A).

    
risposta data 30.03.2011 - 13:53
fonte
2

Cose che potrebbero farlo fuori di testa ...

hai detto che non hai avuto sbalzi di tensione o cali di tensione. Come lo stai confermando? Avevamo un'aula in cui gli alimentatori per PC stavano soffiando apparentemente a caso. Dovevamo fare in modo che il personale addetto alla manutenzione colleghi un misuratore di monitoraggio al circuito e scopre che la presa ha enormi picchi di tensione.

La memoria non è inserita correttamente e danneggia i dati.

I cavi dell'unità sono allentati.

dischi rigidi marginali con un set di settori non valido, ma non abbastanza male da attivare avvisi o scansioni per settori danneggiati.

Qualcosa nel lato Windows tramite bootcamp sta modificando l'unità in un modo che l'unità non piace. Protezione dalla copia? Guidare le utilità?

Hai detto che è in un laboratorio. Cosa stanno facendo gli studenti? Stai monitorando o bloccando ciò che può essere eseguito che potrebbe farlo?

Hai detto che questo sembra essere casuale, non ci sono due macchine che si verificano in una fila. Ciò mi indurrebbe a sospettare che sia uno studente o un gruppo di studenti lo stiano causando o che ci sia un problema di alimentazione casuale nel laboratorio che lo causa. C'è un modo per rintracciare chi ha usato per ultimo le macchine per vedere se questo problema sembra seguire magicamente uno dei tuoi utenti?

    
risposta data 17.03.2011 - 14:15
fonte
1

Hai considerato un controllo periodico delle macchine? Potresti facilmente pianificare i passaggi di verifica fsck settimanali (fino a quando non riesci a capire perché la corruzione sta accadendo) e poi a cadenza mensile per tenere sotto controllo le cose.

Con un file system registrato su giornale, ci vuole qualche pessimo trattamento ripetuto affinché i mac si degradino fino al punto di non avviarsi. Anche il software non funzionante non scrive sul lato del sistema di avvio, quindi sospetto che qualcosa non vada bene. Su Mac che si chiudono in modo pulito e attirano l'attenzione ogni volta che vengono riparati errori minori del filesystem (ogni volta che un Mac si riavvia e fsck non è in esecuzione in modalità preen è un segnale di problemi all'orizzonte).

Con una distribuzione di 25 mac, è possibile passare un po 'di tempo in modo proattivo per verificare e vedere i file system che non si stanno spegnendo in modo pulito impostando un server syslog o un altro sistema di controllo centralizzato.

    
risposta data 28.07.2011 - 18:48
fonte
0

Prenderò in considerazione l'attività degli studenti. Se stai usando bootcamp e OS X, allora scommetto che gli studenti stanno andando in crash sul lato Mac per eseguire il boot camp, perché non sono pazienti. Questo può anche essere il caso se è presente un blocco dello schermo.

Suggerisco:

  1. Rimuovi boot camp. Esegui invece una VM in Parallels o Virtual Box. (Ho trovato che Windows XP sotto VirtualBox funziona abbastanza bene.) Configuralo in modo che la Virtual Machine sia immutabile, memorizzata localmente nella vecchia partizione bootcamp. Ciò impedirà ai bambini di rovinare l'installazione di Windows. Reindirizza la loro home directory per leggere la loro home directory del Mac sul tuo server. (Questo è un PITA da impostare per la prima volta, poiché comprende circa un zillion regedit)

  2. Stabilisci una forma di monitoraggio dell'accesso in modo da sapere quali studenti hanno utilizzato quali macchine. Questo ha il vantaggio che è possibile individuare lo stesso bambino che accede su più macchine, di solito facendo questo come un favore per qualcuno che è bannato. Ho impostato che quando lo stesso login era su due macchine, entrambe le macchine sono state riavviate.

risposta data 18.02.2013 - 20:45
fonte

Leggi altre domande sui tag