Andrea Beggi

For a list of all the ways technology has failed to improve the quality of life, please press "3".

Scrivo mentre aspetto che finisca un backup

A T T E N Z I O N E ! Questo post ha piu' di sei mesi. Le informazioni contenute potrebbero non essere aggiornate.

Una azienda con poche persone e 5 o 6 client, aperta un paio di anni fa, ha deciso di partire con una infrastruttura largamente sovradimensionata: ha 3 server che ricoprono i ruoli di:

  • Domain controller, file e print server, database server, backup server
  • Mail server (Exchange 2007)
  • NAS (Windows Storage Server 2003 R2)

Tutti i server sono HP Proliant e hanno controller RAID, con vari livelli di protezione. Inspiegabilmente il cliente si è rifiutato di installare un gruppo di continuità, e a seguito di uno sbalzo di tensione nelle scorse settimane sono stati sostituiti un disco due dischi e uno degli alimentatori del domain controller. La sostituzione non è stata felice: adesso un altro disco è in modalità “preguasto” a seguito segnalazione S.M.A.R.T., e questo preclude il rebuild di uno dei nuovi dischi appena sostituiti.

La stessa cosa adesso succede con il mail server, però i dischi in “preguasto” sono due, il che rende impossibile anche qui la eventuale ricostruzione dell’array. La chiamata in HP ha confermato la cosa.

Risultato: altri 3 dischi da sostituire, ma questa volta gli array RAID svaniranno come lacrime nella pioggia. Due server da rifare da zero = dominio fumato. Reinstallare DC e mail server. Un po’ di backup si riesce a fare, ma incompleto poiché i problemi dei dischi bloccano la copia dei file ogni pochi minuti. I backup sul juke-box di nastri (c’è anche quello) è incompleto a causa degli errori, il db di Exchange funge ma è corrotto e non si riesce a fare un dump dei db SQL della contabilità. Evviva.

(Forse si recuperano i system state delle macchine e i file con i db SQL, ma non lo sapremo fino all’ultimo.)

Aggiornamento: Il ripristino è raccontato qui.

Questo post non è taggato.

25 Commenti

Enrico Piccin | #

Ciao Andrea,
Seguo il tuo blog da circa un anno e ogni qual volta ti inbatti in problematiche sistemistiche di questo tipo mi tiri su il morale perchè dico: “non capita solo a me allora!”.

Comunque essendo un addetto ai lavori, dico questo:
La problematica che hai descritto è all’ ordine del giorno, perchè purtroppo non si riesce mai a far capire al cliente che un server anche da 3000€ senza un Ups non conta molto e potresti spenderne altrettanti successivamente in guasti e ore di lavoro per sistemarli.

Il pensiero comune è: va bene spendere migliaia di euro in macchinari ed attrezzature, ma quando si parla di spese IT bisogna risparmiare e poi i risultati si vedono e si sentono…

Frieda | #

Coraggio! (ma così pochi e con un server di posta? Mah..)

Francesco | #

Da una parte si può dicre che se la sono cercata, non volendo prendere l’UPS. E poi… non avevano i backup “pre sbalzo” da cui recuperare i dati? Magaris ono vecchi, ma almeno ci sono.

In bocca al lupo!

Andrea | #

Andrea consolati: almeno da quegli uffici c’è una vista mozzafiato….

p.s. i dischi sostituiti erano 2 e un alimentatore!

saluti e in bocca al lupo!

Marco | #

6 client ed il mail server in casa, si chiama suicidio, piuttosto separa DC e DB. poi exchange 2007 su un’unica macchina lo vedo già in discesa verso gl’inferi. complimenti al comerciale di turno, riferisci pure 😉 ciao!

Paolo | #

Andrea, approfitto del tuo post per chiederti un parere: Il mail server in casa quando ha senso?

Ciao!!!

Giuliano | #

Mi accodo alle persone che capiscono la tua sofferenza in quanto già provata.
Ma dico un cliente che prende tre signori server (secondo me saranno dei DL380 g4 o g5) poi non prende uno straccio di ups, ma soprattutto non fa i backup come si deve (magari anche una prova di restore una volta ogni tanto)
L’exchange server poi √® un mistero, Microsoft consiglia exchange dopo 75 utenti, vabb√®ci pu√† stare a 40-50 ma 6 client? e poi l’edge server? non sar√† mica tutto su una macchina.
Il commerciale non è stato una volpe, ma anche il primo tecnico che ha buttato tutto su non scherza.

in bocca al lupo buon lavoro

Lorenzo | #

Più che altro, Exchange per nemmeno 10 caselle di posta mi pare un po’ sprecato, a meno che non usino intensivamente gli strumenti di collaborazione, se è solo per la posta, per me è meglio usare un prodotto più semplice, tipo Hmailserver (anche se è un po’ che non lo uso) con IMAP. Sempre se non usano Windows Server Small Business: io non ho ancora usato la versione 2008, ma per me la versione Small Business 2003 è il MALE! 🙂

Massimo | #

Da quasi profano chiedo: perché usare un server di posta interno (con tutti i problemi gestionali che ne conseguono) quando ci sono hosting providers che offrono uguali caratteristiche e livelli di servizio garantiti (a pagamento, di solito)?
Che numero di client suggerisce l’una o l’altra soluzione?

Lorenzo | #

Beh, io preferisco, quando possibile, tenermi il server di posta in casa, è vero che richiede più manutenzione, però so che in questo caso dipende tutto da me, nel bene e nel male. Quando c’è qualcosa che non va e io non posso farci nulla perché il servizio non è gestito da me, mi prende un nervoso… 🙂

Ale | #

Mazza che fortunello, ci mancava che prendevi la scossa dalla tastiera ed eri a posto…!!
Concordo comunque sull’assurdità del mail server interno (a meno che non ci siano state circostanze particolari) soprattutto quando si parla di exchange che a parer mio risulta un pò fragile e vincolante.

Michele | #

con acronis fai un backup, formatti il server ricreando l’array e poi fai il ripristino.

Andrea | #

Michele, è stata la prima cosa che ho provato a fare. Acronis vede l’array ma non vede la scheda di rete, quindi nisba. inoltre, essendoci molto probabilmente dei settori danneggiati, non credo che la creazione dell’immagine sarebbe andata a buon fine.

Michele | #

se non vede la scheda di rete copia l’immagine in un disco usb.
oppure potresti copiarti il contenuto dei dischi col comando dd di linux.

Marco | #

Ciao Andrea, sono stato ieri a una dimostrazione hp sulla gestine degli Smart Array controllers e qualche simulazione di crash,
Ma perchè quando vado dai clienti non si presenta mai la stessa situazione descritta in manuale o simulazione viste?

ps, una volta mi ha chiamato una società a ripristinare ad su un server deceduto , unico backup un systemstate di un centinaio di giorni, ma dove è finito il buon vecchio “erd” di windowsNT, ciao Marco

Andrea | #

Troppi dati, USB non praticabile, ammesso che funzioni. Non sono sicuo che linux veda tutto l’hardware senza smadonnare coi drivers.

johnstock | #

E bello quando Acronis ti spara 4-5gg per la fine del backup.
Considerando che il conteggio è di tipo ottimistico…

Michele | #

quindi alla fine come hai risolto?

Conzi | #

mai usato Drive SnapShot?
backup a caldo (e funziona).
Ripristino partendo con un bart pe e driver necessari.

Daniele | #

Io che ora sono passato da tecnico a commerciale, provo a spiegare cosa sarebbe indispensabile per una infrastruttura IT, ma i titolari preferiscono glissare su certi argomenti per poi piangere miseria sul cruscotto della propria Audi A8 o Maserati Quattroporte. In fondo è meglio cosi’…due tre giorni di lavoro per Andrea son sempre ben accetti.

Daniele | #

P.S. Per il baccap usiamo Yosemite ( ora Barracuda ) e ci ha salvato le chiappe piu’ volte.

Alberto | #

Ma che fino ha fatto il db di Exchange…non era corrotto?

Andrea | #

Certo, dell’altro server se ne sta occupando un collega.