A T T E N Z I O N E ! Questo post ha piu' di sei mesi. Le informazioni contenute potrebbero non essere aggiornate.

Una azienda con poche persone e 5 o 6 client, aperta un paio di anni fa, ha deciso di partire con una infrastruttura largamente sovradimensionata: ha 3 server che ricoprono i ruoli di:

  • Domain controller, file e print server, database server, backup server
  • Mail server (Exchange 2007)
  • NAS (Windows Storage Server 2003 R2)

Tutti i server sono HP Proliant e hanno controller RAID, con vari livelli di protezione. Inspiegabilmente il cliente si è rifiutato di installare un gruppo di continuità, e a seguito di uno sbalzo di tensione nelle scorse settimane sono stati sostituiti un disco due dischi e uno degli alimentatori del domain controller. La sostituzione non è stata felice: adesso un altro disco è in modalità “preguasto” a seguito segnalazione S.M.A.R.T., e questo preclude il rebuild di uno dei nuovi dischi appena sostituiti.

La stessa cosa adesso succede con il mail server, però i dischi in “preguasto” sono due, il che rende impossibile anche qui la eventuale ricostruzione dell’array. La chiamata in HP ha confermato la cosa.

Risultato: altri 3 dischi da sostituire, ma questa volta gli array RAID svaniranno come lacrime nella pioggia. Due server da rifare da zero = dominio fumato. Reinstallare DC e mail server. Un po’ di backup si riesce a fare, ma incompleto poiché i problemi dei dischi bloccano la copia dei file ogni pochi minuti. I backup sul juke-box di nastri (c’è anche quello) è incompleto a causa degli errori, il db di Exchange funge ma è corrotto e non si riesce a fare un dump dei db SQL della contabilità. Evviva.

(Forse si recuperano i system state delle macchine e i file con i db SQL, ma non lo sapremo fino all’ultimo.)

Aggiornamento: Il ripristino è raccontato qui.

Questo post non è taggato.

Related posts