Andrea Beggi

These things, they go away, replaced by everyday.

Sistemi di storage

A T T E N Z I O N E ! Questo post ha piu' di sei mesi. Le informazioni contenute potrebbero non essere aggiornate.

Storage

Lo storage dei dati rappresenta un’area di grandissima importanza operativa e strategica; con il passare del tempo i bisogni di utenti ed aziende sono cresciuti sempre più. Negli ultimi anni sono nati una serie di nuovi sistemi per venire incontro a queste esigenze. Anzitutto la tecnologia dei dischi: ai tradizionali SCSI e PATA (IDE), si sono aggiunti SATA, SAS e FATA (si veda Wikipedia per i dettagli). Si tratta di nuovi sistemi, che ibridano le caratteristiche dei loro predecessori con nuovi tipi di bus, per ottenere una gamma di prodotti adatti a coprire tutti i toni dello spettro affidabilità-prestazioni-costi. Nuovi chassis permettono oggi di modulare i livelli di RAID secondo le proprie esigenze più capillari: RAID 5 per rapporto qualità prezzo, RAID 1 per sistemi entry level, RAID 1+0 per il massimo livello di protezione senza rinunciare alle prestazioni.

Di pari passo le possibilità di connessione si sono sviluppate; i principali sistemi utilizzati sono:

  • DAS (direct attached storage), con i cestelli dei dischi collegati direttamente al controller del server tramite bus nativo, di solito SCSI, interni o esterni, più raramente fibra;
  • NAS (network attached storage), unità file server stand alone con poca “intelligenza” a bordo, che offrono storage via file sharing;
  • SAN (storage area network), librerie di dischi collegate in fibra, opportunamente partizionate e “presentate” ai server come volumi aggiuntivi.

Il termine DAS si riferisce ad un sistema di storage attaccato direttamente al server che lo utilizza, senza alcuna rete frapposta e senza alcuna possibilità di condividere le risorse senza un intervento “attivo” del server stesso. Si tratta del sistema tradizionale largamente utilizzato fino a qualche anno fa.

I sistemi NAS offrono i loro servizi tramite i protocolli consolidati di file sharing, ed espongono le loro risorse come dichiaratamente “remote”. I due estremi dei sistemi NAS sono rappresentati da un parte dal disco esterno da qualche centinaio di giga, dotato di interfaccia ethernet che compriamo al centro commerciale e attacchiamo alla nostra rete di casa, dall’altra da un server dotato di molto spazio, configurato per ottenere ridondanza, ed equipaggiato con un sistema operativo vero e proprio, che lo rendono quasi indistinguibile da un server normale.

I vantaggi dei sistemi NAS sono la loro economicità (relativa), facilità di installazione, di integrazione con le risorse esistenti e la facilità di gestione che deriva spesso dal loro essere “appliance”, scatole nere con una presa di rete, spesso configurate tramite un browser. Gli svantaggi derivano tipicamente dai problemi di banda da cui sono afflitti: gli strati sovrapposti di interfaccia nativa, file system, TCP/IP ed ethernet (spesso gigaethernet) non consentono di raggiungere prestazioni adeguate al vero “online”, ma relegano la loro applicazione ai campi del file sharing e dei backup near on line.

I sistemi SAN sono particolarmente potenti e flessibili; le batterie di dischi possono essere gestite con diversi livelli di astrazione, a seconda delle capacità del prodotto. Si possono creare degli storage pool, a loro volta divisi in volumi con diversi livelli di ridondanza RAID, per conciliare prestazioni, affidabilità e costi. Ciascun volume è poi partizionato e “presentato” al/ai server di competenza, che vedono la risorsa a livello “block”, come se fosse locale. La connettività della SAN è affidata perlopiù alla fibra ottica, spesso ridondata con l’uso di doppi switch, ma esistono anche altri tipi di rete.

Tra i vantaggi principali, la grande velocità di accesso ai dati, grazie alla maggiore ampiezza di banda, dovuta al ridotto numero di strati ed alle maggiori prestazioni di connettività, e la flessibilità di gestione dello spazio: aggiungere nuovi dischi ai cestelli è un’operazione veloce e tutto sommato relativamente economica. Questi due aspetti sono punti chiave per la scelta di un sistema di questo tipo.

Un sistema abbastanza diffuso è iSCSI, nel quale si usa il protocollo SCSI over TCP/IP, generalmente veicolato via gigaethernet. Il vantaggio è di avere un sistema SAN, quindi block level, ma con costi inferiori, dato che si rinuncia alla fibra. Di contro, le prestazioni sono inferiori e per alcune implementazioni non è un sistema supportato particolarmente performante, VMWare ESX su tutte. (VMWare EXS non supporta l’hardware initiator per tutti gli iSCSI, per gli altri usa il software initiator, che è improponibile se si desiderano prestazioni decenti).

La pratica della server consolidation tramite virtualizzazione consente di ottenere una migliore gestione e uno sfruttamento più capillare delle risorse di calcolo dei server moderni. Con l’aumentare della diffusione di questa tecnologia, anche lo storage è sottoposto ad un processo di consolidamento che permette per utilizzare meglio le grandi capacità dei moderni dischi. Soluzioni come NAS e SAN vengono incontro a queste esigenze, permettendo di valorizzare al meglio gli investimenti ed in alcuni casi di riutilizzare lo spazio su disco che andrebbe inevitabilmente perso se residente sui singoli server.

(Nell’immagine un IBM 3330 del 1956).

Tags:

16 Commenti

dat | #

se puo’ essere utile, soprattutto in ambiente casalingo, per il NAS versione “server esterno” io mi trovo bene con FreeNas http://www.freenas.org/
saluti
dat

Giuseppe Aniello | #

davvero ottimo articolo… complimenti, non è facile che riesca ad interessarmi a qualcosa di serio a quest’ora :)

frhell | #

a me risulta che vmware supporti l’iscsi…

yLothar | #

Non so se ho capito bene leggendo la parte iSCSI ma se il senso della frase era che per VMware ESX non c’è supporto iSCSI c’è un errore e una precisazione da fare. Dalla versione 3 in poi ESX supporta iSCSI, dalla 2.5.X in giù no. Per chi volesse avere un’idea di iSCSI in VMware 3 si può partire da qui: http://www.vmware.com/resources/techresources/552. Tra l’altro ESX 3 supporta anche il “montaggio” di risorse rete via NFS che – prestazioni a parte – a volte è molto comodo e può “salvare la vita” :)

fabio torazza | #

ti capita realmente di imbatterti in san in fibra ?
lo si intuisce dall’articolo,
cmq non è bene specificare che le unità in san comunicano in una “loro” rete “riservata” (appunto in fibra) , un po’ come avviene nei cluster ?

Well done!

Andrea | #

Ho corretto le mie affermazioni su VMWare. In realtà la frase non doveva uscire così, poi mi sono perso per strada….

pasquale | #

grande!

becci | #

Non vedo l’ora che i DAT vengano ritirati dal commercio.

spippolazione | #

IMHO openfiler e’ un gran bel pezzo di software per fare il nas, anche a livello professionale…

non l’ho ancora provato, anche se prima o poi mi dovro’ decidere a metterne uno in ditta, ma da quel che leggo e’ tanta roba :-)

Maurizio | #

Grande e compendioso articolo, fa piacere trovare qualcuno che “perda” il tempo a parlare di storage…i tempi sono proprio cambiati da quando quei grossi frigoriferi blu campeggiavano nelle sale macchine mainframe ..(e sì, ho -quasi – visto i 3330 di persona…..)
questo è il segno che non ci si preoccupa più dei frigoriferi ma delle informazioni che contengono e come queste devono essere gestite (SAN, NAS, iSCSI etc etc).
Per quanto riguarda il commento a proposito di una SAN come rete dedicata, in realtà se uno dei criteri di scelta sono le prestazioni anche il collegamento NAS (sebbene su rete IP e non FC) si preferisce farlo con router dedicati e non condivisi con le applicazioni.
magari la prossima volta vi invito ad un blogo sulle nuove tecnologie e sui trend di mercato
ciao
Maurizio