Définitions

SIO > S2_SISR > S2C04_stockage > S2C5B Stockage NAS et SAN.md

Définitions

Voir le cours sur les sauvegardes pour faciliter la lecture de celui-ci

Un NAS (Network Attached Storage) et un SAN (Storage Area Network) sont deux solutions de stockage en réseau, mais ils ont des architectures et des usages différents.

Un NAS (Network Attached Storage) est un serveur accessible via le réseau local et contenant des disques de stockage de fichiers.

  • Disque dur connecté au réseau local,
  • Accessible via une appli web (mini OS souvent basé sur Linux ou BSD avec FTP ou une appli de cloud)
  • Accès par NFS ou FTP, SMB (samba)
  • Souvent équipé de plusieurs disques en RAID1 à 5+1 selon le degré objectif de sécurité

La solution est meilleure qu'un simple serveur de fichier par la présence des applis et de différents modes d'accès, le raid.
Le coût est très abordable (moins de 1000€) par rapport aux SAN.

Un SAN (Storage Area network) est un réseau indépendant, rapide, maillé de serveurs de stockage en réseau.

  • connexions fibre et switch performants – niveau 3, réseau maillé
  • Sauvegarde par redondance/réplication, par externalisation, etc. …
  • ressemble à plusieurs NAS dans un réseau spécialisé,
  • souvent disques en RAID5+1
  • très haute disponibilité et forte résilience en raison des redondances à de multiples niveaux (maillage, raid, réplications, etc.)

C'est un véritable cloud de stockage (local ou distant) mais là où le NAS partage des fichiers, le SAN partage des disques.
Un serveur pourrait donc n'avoir aucun disque interne et uniquement des disques dans le SAN.

L'inconvénient majeur : son coût du fait des technologies utilisées (fibre et redondances).
C'est pourquoi, il n'est utilisé qu'en entreprise avec des datacenters d'une certaine importance.

NAS = Network Attached Storage

Fondamentalement, un NAS est un serveur de fichier

  • Peu de matériel acheté ou "tout-en-un", rackable,
  • Moins de machines, gestion automatisée et centralisée,
  • Souvent préconfiguré, configuré par le web, mise en domaine(s),
  • Disques rapides en grappes RAID (sata, sas, ssa, …)
  • Sauvegarde extériorisée, Sur un autre support (les disques peuvent être amovibles à chaud)

Exemple de fonctionalités

Dépend du système et logiciel embarqué.

  • Sauvegarde plus simple et sécurisée (elles sont hors du système local et non manipulées par un utilisateur : pas d'arrachement de disque externe, de panne de connexion, etc.)
  • Supporte souvent différents types de sauvegardes : complètes, miroir, incrémentale et différentielles
  • Serverless backup : copie sans serveur de sauvegarde (le NAS est le serveur),
  • Snapshot d'un disque, d'une partition. SAV intégrale
  • Datamover : déplacement des données vers un espace au statut "sauvegardé", réalisé après un snapshot, permet des SAV cumulatives

Le protocole de sauvegarde est souvent NDMP (Network Data Management Protocol) : protocole de comm. std permettant la sav des NAS sur un réseau,

inconvénients :

  • Risque de surcharge du réseau (bande passante !!),
  • Multiplier les NAS en cas de surcharge d'un nas, ou pour multiplier les sauvegardes locales (ce qui charge aussi le réseau)

Détail des fonctions embarquées

On distingue plusieurs types de sauvegarde pouvant être mises en place, en voici quatre exemples :

Serverless backup : copie sans serveur de sauvegarde.

Des agents à faible impact sur le serveur de production sont chargés de répertorier les blocs de données modifiés. Un système disposé sur le NAS se charge d’effectuer la sauvegarde des blocs désignés.

Snapshot (prise de vue instantanée)

Il s’agit de la réalisation d’une copie instantanée d’un disque ou d’un système de stockage (NAS par exemple).
Cette opération très rapide est effectuée pendant la production. On peut conserver plusieurs de ces « images » prises à des instants stratégiques pour sécuriser les systèmes de données.
Une manière simple d’obtenir un snapshot consiste à conserver un maximum d’anciens blocs de données en réécrivant les données ailleurs après modification.

Datamover : Application qui se charge de déplacer les blocs de données

Utilisée généralement pour la sauvegarde.
Située sur le dispositif de stockage, elle permet ainsi un « backup » de type « serverless ».
Une amélioration possible consiste à mettre en oeuvre le datamover derrière le snapshot.

NDMP (Network Data Management Protocol)

C'est un protocole de communication standard permettant la sauvegarde des NAS sur un réseau.
Il permet aux applications de sauvegarde de communiquer directement avec les périphériques tels que les librairies robotisées pour effectuer les sauvegardes et les restaurations.


Les trois premiers types de sauvegarde ne nécessitent pas de serveurs supplémentaires ce qui est un gain en terme de coût et d’installation.
Choisir le type de technologie à mettre en place en fonction de l’importance des données à sauvegarder.
La solution NDMP est sans doute plus sécurisée car les données sont sauvegardées extérieurement au serveur de stockage NAS et sur un autre type de média (bande, disque optique).

SAN = Storage Area network

Un SAN est un réseau de stockage

  • basé sur la topologie Fibre Channel, indépendante et multicouches fonctionnant en série et se comportant exactement comme une liaison téléphonique,
  • ouvert et évolutif qui relie des serveurs/stations et postes de travail à des périphériques de stockage.
  • utilise les protocoles SCSI.

Il virtualise totalement l'espace de stockage et travaille au niveau des blocs (et non des fichiers comme les serveurs NAS). Ceci permet le partage centralisé des données via des "switches" Fibre Channel.

Les SAN peuvent être connectés à des milliers de serveurs afin de constituer des systèmes de calcul évolutifs et surpuissants.
Ils sont surtout présents au sein de laboratoires de recherche dans les domaines industriels, environnementaux, militaires, financiers,...

Un SAN se différencie des autres systèmes de stockage tel que le NAS par un accès bas niveau aux disques.
Pour simplifier, le trafic sur un SAN est très similaire aux principes utilisés pour l'utilisation des disques Internes (ATA, SCSI).
C'est une mutualisation des ressources de stockage.

Les baies de stockage d'un SAN n'apparaissent pas comme des volumes partagés sur le réseau mais sont directement accessibles en mode bloc par le système de fichiers des serveurs.
En clair, chaque serveur voit l'espace disque d'une baie SAN auquel il a accès comme son propre disque dur.

Un serveur peut ne pas avoir de disque interne et son espace de stockage être totalement dans le SAN.

Conséquence : L'administrateur doit définir très précisément les unités logiques (LUN) et le zoning (espace alloué à chaque serveur), pour qu'un serveur A n'accède pas aux mêmes ressources qu'un serveur A et utilisant un système de fichiers différent.

Les SAN sont bien adaptés aux applications demandant un stockage dédié, comme les bases de données, qui demandent une mise à jour permanente, et le traitement des transactions en ligne (OLTP).

Caractéristiques essentielles de l'architecture SAN

Un SAN se distingue par les caractéristiques suivantes: – Permet aux serveurs un accès partagé à une ferme de stockage commune et à une ou plusieurs unités de stockage sur de bandes pour la sauvegarde et la restauration. – Utilise un réseau Fibre Channel séparé spécifique au stockage. – Assure les transferts de données stockées entre les serveurs et les dispositifs de stockage sur le SAN, allégeant de ce fait la charge du LAN. – Permet l'installation distante de sous-systèmes de disques durs et d'unités de stockage sur bandes.

Il y a encore peu de temps on ne trouvait des SAN que dans les grands centres informatiques de société ayant besoin d'un grand volume de stockage très sécurisé.
Les prix devenant plus raisonnable, des centres informatiques plus modestes s'équipent d'architectures SAN plus simples (tel que représenté dans le schéma).

Synthèse SAN

Accès partagé à une ferme de stockage et librairie de sauvegarde. Organisations utilisant :

  • de nombreux serveurs (finance, calculs, recherche, armée, …)
  • des bases de données importantes, dynamique forte

2ème Réseau indépendant !! Réseau Fibre Channel séparé spécifique au stockage

  • Basé sur des switchs à fibre optique (rapidité)
  • Protocole SCSI (disques SAS, SSA ou iSCSI) très haut débit
  • Stockage à distance

Virtualise l'espace de stockage Sépare le trafic de stockage et partage entre serveurs et le reste du LAN

  • Bas niveau (bloc de données)
  • Directement accessible par l'OS, comme si le disque était local
  • Paramétrage des disques à chaud

Allocation disque paramétrable à chaud Danger si un OS déborde sur l'espace d'un autre OS (autre FS)

  • LUN (Logicals Units), zonning
  • Contrainte d'administration, rigueur !!

NAS ou SAN ?

  NAS SAN
Compatibilité OS Env. hétérogèneMultiplier le matos
Volume de stockage Max 3 à 4 disques Plus évolutif, gros à très gros volumes
RAID Souvent RAID 1, parfois 5 RAID 5 et plus
Disponibilité Peu de sécurité Sécu maxi : redondance, reprise après incident, etc. …
Administration Plus simple Outil d'admin parfois spécifique
Installation Quelques minutesÉtude approfondie, infra complexe
QoS Bof, peu contrôlée Débit & sécurité garantis
Coût Faible Cher : Infrastructure, switchs, serveurs, admin. …
Support multilingue Selon fournisseur Normal
Mode d'accès FichiersBloc de données
Protocoles http, ftp, smb, nfsiSCSI, Fibre Channel

  • NAS : simple et économique, stockage et partage de fichiers, sauvegardes ; lent,
  • SAN : performances de communication et charge de travail critiques ; rapide mais (très) cher.

Les grandes structures ont souvent un mix de NAS et SAN.

Un travail associé ?

Oui, bien sûr.

Travail basique et avancé

  • créer un serveur de fichier basique, basé sur ftp (comme tous les serveurs basiques)
  • créer un serveur de fichier avec Samba ou rsync pour délocaliser les fichiers d'un serveur sur une autre machine (utile pour des serveurs web répliqués)
  • créer un serveur de cloud simple avec une application comme nextcloud ou owncloud.
  • créer .. un mix des solutions ci-dessus : le top des serveurs.
    Ce travail qui peut être plus ou moins approfondi est très intéressant par les différentes technologies parcourues.
    Il comporte cependant le défaut d'être morcelé et un peu long à mettre en oeuvre.

Travail assisté

  • créer un serveur True Nas contenant différentes applications préconfigurées. Ce travail est intéressant par l'installation et la gestion d'une application professionnelle "tout-en-un".
    Le revers de la médaille est que le contexte étant automatisé, peu de technologies de communication, de synchronisation sont abordées en détail.
    Le mâitrise de celles-ci est donc moins profonde que dans le premier cas.