Post chilometrico, abbiate pazienza. Se siete sistemisti apprezzerete meglio le sfumature, per gli altri: accozzaglia di sfighe varie ed eventuali.

Sabato mattina, ore 10. Dormo della grossa, la sera prima ho fatto le 2:30. Squilla il mio cellulare e rispondo senza prestare troppa attenzione: “Ahhh server! Server! Il server non si accende, non funziona nulla! Martedì dobbiamo consegnare le dichiarazioni, ieri abbiamo lavorato fino all’una! Ahhh vieni subito!” Trattasi di mio cliente storico (ecco perché ha il mio cellulare), studio di commercialisti”. Balbetto qualcosa tipo “Vi richiamo.” e tento di svegliarmi.

Sono solo con Bibi, Nives lavora. La nostra reperibilità è solo per interventi remoti sui server nostri e dei clienti in housing o hosting presso la nostra sala macchine; di interventi non ne facciamo, e comunque il cliente non ha neppure un contratto che lo preveda, quindi è inutile che io chiami il mio collega di turno questo fine settimana.

Diviso tra il diavoletto (“Spegni il cellulare! Fregatene! Non sei tenuto a andare oggi! Hai sonno e inoltre vuoi stare con Bibi.”) e l’angioletto (“Li conosci da tanto tempo. Sono veramente nei casini. Rischiano di rimetterci una barca di soldi. Pensa se fossi tu al loro posto. E poi lo sai che i sensi di colpa ti annienterebbero.”), decido di accumulare altro Karma positivo, e scelgo di andare. Che poi se scopro che ’sta cosa del Karma è una stronzata… qualcuno ne dovrà rendere conto. Non so bene chi, ma qualcuno da prendere a calci nel sedere lo trovo.

Mi lavo, convinco Bibi a lavarsi, mi vesto, vesto Bibi, convinco Ginger che no, anche se è sabato non può uscire con noi, prendo la macchina e vado verso il centro sperando che sia una roba tipo un floppy dimenticato nel drive o comunque una stronzata: prima avevo troppo sonno per suggerire soluzioni. Nel frattempo avverto il mio capo: va bene il Karma, ma almeno l’azienda sappia che vado a lavorare.

Dopo un caffè per schiarirmi le idee, salgo dal cliente. Affido Bibi a due volenterose impiegate, e capisco subito che sarà una lunga giornata. Tanto per darmi il benvenuto, il controller IBM ServeRaid 5i mi dice: “Logical Unit: 0″; per forza non parte: ’sto server manco lo sa, di avere dei dischi. Maledetto. Faccio melina, tanto per scambiare due battute con il titolare, e intanto riavvio un paio di volte dopo aver staccato tutto lo staccabile. Nisba.

A questo punto faccio la Prima Mossa Del Sistemista Ninja™: dal BIOS del controller utilizzo la pratica opzione “Copia configurazione RAID dai dischi al controller”. Soddisfatto della mia sagacia, riavvio baldanzoso e la sorte sembra arridermi: uno dei tre dischi (è un server piccolo, ho dimenticato di dirvelo) è in stato DEAD, morto, kaputt, ma gli altri due fungono. “Logical Unit:1″, sia mai che…. e infatti! Il menu di avvio dell’MBR di Windows 2000 Server mi sorride dallo schermo. Premo invio per far effettivamente partire il sistema, ma…. “NTOSKRNL.EXE is missing or corrupt”. Per i non addetti, uno degli errori più temibili nonché rognosi che si possano incontrare. L’ultima cfg “sicuramente funzionante” non va, la console di ripristino neppure. Pessimismo e fastidio.

Mi armo di pazienza, rovisto dentro un po’ di scatole e trovo il CD del sistema operativo, lo caccio nel drive, e. E. Il CD non funziona. Ora che mi ricordo, lo staccai anni fa perché mandava in palla il server. Mai rimpiazzato, le poche volte che è servito ne ho condiviso uno di un client. Smonto un PC decrepito trovato in archivio, bestemmiando perché 10 anni fa HP fissava le meccaniche con 10 viti di 3 tipi diversi, e monto un vecchio CD sul server. Faccio il boot, ma so già che non servirà a nulla: il S.O. non ha i driver per il controller RAID e quindi non vede una beata fava.

Rovisto nuovamente nelle scatole, trovo il CD con i driver, trovo un floppy e ci copio i file. Torno dal mio amico, e secondo voi il floppy funge? Esatto. Torno alla carcassa nell’archivio, e altre 10 viti dopo, ritorno con una vecchia baracca di meccanica floppy che sembra più o meno funzionare. Rifaccio il boot, gli passo i driver, e finalmente vede l’unità logica. Windows 2000 Server non ha grandi tool per riparare una installazione corrotta, l’unica cosa che c’è, il recovery, non mi degna neppure di una flebile speranza: mi fa una pernacchia e mi dice di arrangiarmi nel suo simpatico technichese.

OK. E’ giunto il momento di pronunciare la parola che finora ho fatto finta di ignorare. “Ehm, come stiamo a backup?”. E qui faccio partire il flashback, che a me JJ.Abrams mi fa una pippa.

<flashback>Il giorno precedente, un collega è intervenuto in seguito ad una chiamata: “I Backup non funzionano”.  Questa azienda usa un netdisk per i backup, un disco esterno ethernet Acer Easystore da 1TB in RAID5, con un po’ di script Robocopy che fanno un backup al giorno, uno alla settimana, ed uno al mese; gli ho fatto adottare questa soluzione dopo il secondo tape rotto, e tanto non cambiavano mai le cassette. Almeno così gli arriva la mail e si accorgono se il backup ha funzionato. Improvvisamente gli script hanno smesso di funzionare; il collega venerdì mi chiama e mi dice che tutti i client raggiungono il disco, ma il server no. Pare abbia risolto riavviando il server. Per fortuna ha avuto la presenza di spirito di lanciare a mano un backup dopo che l’accesso si è ripristinato. Comunque, un po’ di salvataggi ci sono, e se siamo fortunati l’ultimo è di ieri; perderanno qualche ora di lavoro, ma pazienza: “piuttosto che nulla, meglio piuttosto”, diciamo a Genova.</flashback>

LA configurazione del NAS Acer si fa via browser, quindi come prima cosa devo rattoppare un minimo la rete, visto che il caro estinto ci elargiva i suoi servigi di DHCP e DNS. Tiro il firewall per la giacchetta e configuro lì sopra un DHCP di fortuna che distribuisca IP e passi i server di Telecom come DNS, oltre che sé stesso in qualità di gateway. Riavvio un po’ di client qua e là e tutto (tutto? cioè, partono) sembra funzionare. Scarico uno scanner di rete perché non so l’indirizzo del NAS, visto che tutta la documentazione era sul desktop del coso in coma di là, lo trovo e ci punto il browser. Voi ve la ricordate la password? Io no. Per fortuna ho la vivida impressione di aver lasciato le credenziali di default; rovisto nuovamente nelle scatole e trovo il manuale in cui cui sono indicati user e password di fabbrica. Li provo e mi faccio mentalmente i complimenti per non essere troppo paranoico quando non serve.

Comunque, guardo un po’ la configurazione e comincio a capire che la giornata non è ancora finita: questa bella scatoletta sembrava incredibilmente comoda un anno fa, quando l’avevo installata: “Hei! Che figata! Importa gli utenti da Active Directory, non devo neppure crearli!”

Che. Enorme. Fregatura.

In mancanza di Domain Controller, morto di fianco a lui, questo pezzo di scatola non ti fa accedere ai dati salvati, perché non autentica l’utente. Le credenziali di amministrazione non consentono comunque di accedere ai dati sui volumi condivisi. I dati ci sono, ma sono blindati perché io ho la chiave, pecccato che manchi la serratura. Non mi perdo d’animo, e consulto Google e le pieghe del menu di configurazione: c’è una voce che recita orgogliosa: “Change Authentication Method”, cioè passare alla gestione con utenti locali. Peccato che un avviso terroristico subito sopra avverta che utilizzando questa opzione si perderanno tutti gli “shared folder assignments”, e passi, ma anche gli “user data”. Opporcammerda!

“User data” si riferirà ai dati relativi agli account utente o ai dati che gli utenti hanno salvato sul NAS? Mistero. Personalmente propenderei per la prima potesi, ma non voglio rischiare. Facciamo il punto: tutti i dati sono su un server che non parte e i cui dischi hanno gravi problemi, i backup non sono accessibili senza fare una scommessa rischiosa. Che vita schifosa. Cinque anni di lavoro, una intera azienda, tutti i dati, tutto. Tutto a rischio di essere annientato; c’è qualche backup sparso in giro su alcuni client, ma roba vecchia e largamente incompleta, e un po’ di nastri fermi all’anno scorso. Urgono un coniglio e un cappello.

A questo punto faccio la Seconda Mossa Del Sistemista Ninja™: estraggo dallo zaino un CD di Acronis True Image Enterprise che ho casualmente trovato a terra poco prima (mica è mia, avevo giusto in previsione di portare questo CD all’ufficio oggetti smarriti. Non è mia. Io non ho la licenza di quel robo lì). Questo sopraffino pezzo di software permette di fare immagini di dischi e partizioni anche via rete o su dischi esterni, permettendo anche di scegliere i dati da includere. La versione Enterprise è sufficientemente furba da riconoscere i controller RAID più comuni di HP, IBM e altri vendor. Sbatto il CD nel drive, riaccendo il cadavere e con mia grande gioia vedo controller, dischi, partizioni, dati. Sembra ci sia tutto, peccato che alcune cartelle non siano selezionabili, pena un crash irrimediabile che porta al riavvio immediato del server. Con pazienza certosina seleziono tutto quello che posso e, assegnato un IP alla scheda di rete, tento di raggiungere un client. :-( Niente, nisba, non vede nessun host, non sfoglia la rete, non permette di inserire a mano l’IP dell’host di destinazione del backup. Una decina di riavvii dopo, estraggo dallo zaino un disco esterno USB da 80 GB, più che sufficienti per il salvataggio, che pesa 36 miseri giga. Lo attacco, ATIE lo vede e finalmente (dopo solo un paio di crash, ecchevvuoichessia?) il programma inizia a creare l’immagine.

So che sarà lunga, nel frattempo torno a cercare di capire cosa succederà al NAS; mentre passo in corridoio mi rendo conto che Bibi, della quale nel frattempo avevo perso le tracce, ha exploitato l’ufficio. Su quasi ogni scrivania ci sono pennarelli suoi, alcuni suoi disegni campeggiano su un monitor, e lei sta giocando a un-due-tre-stella con un paio di impegate amministrative. “Sai, papà, prima abbiamo giocato a nascondino”. Le tipe sono visibilmente provate, ma mai quanto me, quindi le lascio alla loro sorte senza il minimo rimorso.

Improvvisamente mi rendo conto che è ora di pranzo, e saltare non è un’opzione praticabile: Bibi mangia come una squadra di rugby. Devo comunque attendere l’esito dell’immagine su disco, quindi torno a liberare le due malcapitate, che mi guardano tra lo sconvolto e il riconoscente, e porto la prole affamata al più vicino self-service.

Qualche cotoletta, un po’ di patate al forno e un ghiacciolo alla menta dopo, torniamo all’ufficio da cui nel frattempo le due impiegate martiri sono sparite. Convinco Bibi a fare qualche disegno mentre aspetta Nives che sta venendo a prenderla. Acronis mi attende con buone notizie: diversi errori irreversibili di lettura, che, non visto, decido di ignorare bellamente, un errore di scrittura, che porcavacca non mi dirai che il mio HD sta andando, e per far buon peso ci tiene a farmi sapere che ne avrà per almeno altre 4 ore. Simpatico come una cacca nella federa del cuscino.

OK, è ora di reagire. Prendo il titolare, gli spiego cosa sta succedendo il più dettagliatamente possibile, gli faccio presente che non abbiamo altre opzioni poiché la partizione del server è sicuramente troppo danneggiata, e gli spiego la cosa dell’autenticazione sul NAS. Mi accerto che abbia capito il dubbio sulla cancellazione degli “user data”, e gli chiedo l’autorizzazione a procedere.

Lancio il browser, lo punto al NAS e senza indugi clicco su “Change Authentication Method”. Il coso se la prende comoda, mi dice che ci può mettere anche 10 minuti. Il titolare suda, io penso che è sabato, sono stanco, non ne ho più voglia. Qualunque cosa, pur di uscire di qui.

Finalmente il responso: i dati ci sono ancora. Più tardi scopriremo che risalgono a venerdì alle 20; poteva andare molto peggio.

Da qui in poi è solo noia e ordinaria amministrazione: rimappo i client per usare il NAS per i documenti e copio i db su un client Vista Home, frutto di una sciagurata incursione al centro commerciale. E’ l’unico che ha abbastanza spazio su disco e può stare sempre acceso, bello eh? Faccio fare due test e cerco di rappezzare le stampanti, che ormai voglio solo andare via.

Nel frattempo Nives e Bibi hanno fatto un giretto al Porto Antico, io faccio firmare un rapportino da 7 ore festive e mi fiondo a prenderle. Spero che l’intervento venga fatturato con tariffe da idraulico notturno d’urgenza.

Il cliente adesso può lavorare e presumibilmente onorerà le sue scadenze.

<flashforward>E’ martedì. Ho chiamato lo studio, lavorano, son contenti. Per festeggiare gli ho appena consigliato di comprare un altro server per fare il grosso del lavoro, e affiancarvi il vecchio dopo aver buttato un po’ di frattaglie; da RAID5 passerà al mirroring (RAID1), che tanto i ricambi costan troppo, in proporzione.</flashforward>

Tags: ,

Related posts