01 Décembre 2008    

La Lettre de février 2007

Archives

CAS (Content Adressed Storage)

Dossier - la lettre de février 2007

  

Le CAS du siècle...
Le coffre-fort électronique est appelé à remplacer l'armoire forte. Et plus question d'entasser les cartons d'archives à la cave.
Archiver la masse fantastique de documents numériques de manière fiable et probante sera l'un des casse-tête des entreprises dans les années à venir.
Le CAS répond à cette problématique. Comment ?

Conférence guideinformatique.com 9 décembre 2008

L'adressage des fichiers par leur contenu

En premier lieu le CAS (Content Addressed Storage) est un concept d'adressage de fichiers fixes utilisé notamment sur le Centera d'EMC.
Le principe consiste à archiver un fichier non pas suivant son nom, mais suivant son contenu.
Par exemple, habituellement, pour stocker le fichier "resultats.xls", le système va inscrire les données sur le disque et enregistrer sur une table d'allocation, le nom du fichier, l'adresse physique correspondante (ou les adresses si le fichier est réparti sur plusieurs segments), ainsi que quelques données supplémentaires comme la taille ou la date d'écriture. Ce système comporte 2 inconvénients dans une utilisation d'archivage :

  • on peut enregistrer plusieurs fois un fichier strictement identique avec un nom différent ou dans un autre répertoire.
  • on ne peut pas distinguer 2 exemplaires de ce fichier avec le même nom, la même taille, mais avec un chiffre modifié, par exemple.

Dans le cas de l'archivage, il est intéressant de ne pas multiplier les versions identiques d'un même fichier, mais au contraire, il est intéressant de distinguer une version mise à jour.
Le CAS calcule une empreinte numérique (MD5 et SHA256), unique pour un contenu donné (la probabilité pour qu’une adresse soit identique est de 10 puissance 128). On l'utilise alors comme adresse logique du fichier (l'appellation adresse physique, souvent employée, ne semble pas la plus appropriée).
 

Exemple de blocage en archive
Agrandir l'image

 
Ce procédé est une des garanties apportées à l'intégrité du fichier (en cas de modification, il change d'adresse). Cela rend également ce concept impropre à un usage de stockage disque standard et le réserve à l'archivage.

Le CAS pour l'archivage

L'appellation CAS s'est élargie et est désormais utilisée pour tous les systèmes d'archivage qui assurent l'adressage par objet ou par contenu.
Contrairement à une gestion de disque classique, le CAS gère 2 éléments fondamentaux :

  • le contenu proprement dit,
  • les metadonnées (nom, droit d'accès, traçabilité..)

 

Les métadonnées, passage obligé pour le CAS
Agrandir l'image

 
Grâce aux métadonnées, l’objet archivé est indépendant de l’application d’archivage.
Les règles de gestion peuvent être intégrées aux métadonnées ou fournies dans un 3e élément suivant les technologies.
Chaque constructeur propose désormais sa propre technologie CAS pour le stockage des fichiers fixes.

SMI-S et XAM pour normaliser l'accès aux données

A l'initiative des constructeurs, le SNIA (Storage Networking Industry Association) a mis sur pied 2 normes visant à fiabiliser les investissements en rendant applications et plates-formes interopérables :

  • leSMI-S (voir notre fiche) qui fournit sous XML une description des services et éléments de stockage disponibles, SMI-S est essentiellement utilisé pour l'aspect management des unités de stockage,
  • XAM : qui standardise la connection des applications d'ECM (Enterprise Content Management) aux unités CAS , évitant ainsi les connecteurs propriétaires.

Ainsi, à travers ces 2 couches logiques, une application A ou B doit pouvoir accéder indifféremment aux données stockées sur une machine X ou Y. L'accés non propriétaire aux unités CAS est fondamental pour un archivage sur du long terme en permettant le renouvellement des unités au meilleur prix.

Le marché

Le marché du CAS est en forte progression. D'après le Gartner, 97 % des CAS seraient des Centera, leader historique.
 

Ventes mensuelles de Centera dans le monde
Agrandir l'image

 
En France, on recense 150 Centera en France pour 80 à 90 clients et 10 000 dans le Monde. Les grands comptes concernés par l'obligation d'archivage se sont équipés les premiers :

  • les grosses banques archivent dessus leurs images chèques et relevés
  • le secteur hospitalier, pour les PACS (Picture Archiving and Communication Systems)
  • le secteur pharmaceutique, notamment pour les mails et brevets
  • l'assurance : dossiers et contrats,
  • l'industrie : Renault, STMicro

Recherche         
fermer