MENU
THEMES

WORM sur disque magnétique

Publié le: 07/02/2007  |  Mis à jour le: 25/03/2013  |  Par: Guideinformatique  

On peut utiliser n'importe quel support pour archiver. Mais pour un "archivage légal", il est préférable d'utiliser un support non modifiable. Pour cette raison, les opérateurs ont d'abord tourné leur regard vers les supports optiques WORM (DON, CD, DVD...). Toutefois, plusieurs fabricants proposent désormais des baies de stockage à base de disques magnétiques conjuguant les avantages des disques magnétiques et la garantie de non réinscriptibilité. Examen de 3 philosophies, le SnapLock de NetApp, le HCAP d'Hitachi et le Centera d'EMC.

Pourquoi un Worm ?

La législation n'apporte (heureusement) aucune précision sur les choix techniques susceptibles de répondre aux critères indispensables à un archivage légal. Toutefois, cette notion d'archivage légal impose que l'on s'assure que le document que l'on a conservé puisse être restitué en apportant l'assurance qu'il n'a pu être modifié. L'utilisation d'un support inscriptible une seule fois (WORM) est donc préconisée.
Mieux, la norme NF Z 42-013 n'accepte que les supports de type optique non-réinscriptible. Cette norme, rédigée en 1999 et mise à jour en 2001 doit être remise au goût du jour (on parle maintenant de fin 2007). Cependant, si l'obéissance à cette norme française est une piste à suivre, ce n'est pas la seule et l'unique. Les Worm logiques à base de disques magnétiques semblent pouvoir répondre aussi bien, voire mieux par certains aspects, aux exigences de ce type de conservation.

Pourquoi un disque magnétique ?

Au moins 4 avantages plaident pour l'emploi de disques magnétiques à la place des supports optiques :

  • la rapidité d'accès et de transfert des données: les supports optiques sont en effet généralement peu performants. Toutefois, concernant l'archivage, c'est-à-dire des documents qui ne seront probablement consultés que de manière exceptionnelle, le critère de rapidité n'est pas forcément prédominant.
  • la fiabilité du support : la durée de vie des supports optiques étant relativement courte (5 à 10 ans), il faut prévoir un cycle de duplication régulière, permettant d'assurer la pérennité voulue. Les disques magnétiques intégrés à des baies de type RAID, peuvent être remplacés à chaud, les données se trouvant dupliquées et automatiquement regénérées.
  • la migration technologique: les normes et technologies inhérentes aux disques, lecteurs, armoires... évoluent rapidement. En cas de migration, il est plus simple de vider le contenu d'une armoire ancienne dans une nouvelle, plutôt que relire tous les supports optiques ou toutes les bandes magnétiques.
  • la possibilité de supprimer un fichier : cela peut paraître paradoxal de vouloir supprimer une archive, mais la loi impose désormais que les données à caractère privé ne soient pas conservées au-delà d'une durée normale d'utilisation. Or, sur un support optique, les possibilités de suppression sont pour le moins limitées.
Principe du Worm logique

Les différents systèmes de Worm logiques reposent sur des baies de stockage généralement désignées sous le terme CAS (Content Addressed Storage) - voir cette fiche. Les disques sont associés dans des dispositifs de type RAID (voir cette fiche). Les données sont automatiquement dupliquées pour pallier les pannes. En cas de panne, les disques sont échangeables à chaud. Les données sont reconstituées sur les nouveaux disques à partir des données stockées de manière redondante. Pour garantir que les fichiers ne sont pas altérés ou modifiés divers dispositifs ont été imaginés, tous basés sur le cryptage et la signature électronique (voir cette fiche). Les différents constructeurs proposent des concepts plutôt différents en terme d'architecture, et donc de caractéristiques. Les critères de différentiation sont :

  • la sécurité : qui est soit embarquée ou soit gérée à l'extérieur (Centera et HCAP intègrent ce service,.NetApp le confie à une application tierce extérieure),
  • l'accès aux données : qui est soit direct ou soit à travers une API (Centera et SnapLock font appel a un système d'indexation de contenu externe, HCAP intègre son propre moteur d'indexation).

Schématiquement, on pourrait discerner :

  • des plates-formes "classiques", comme NetApp, qui disposent d'une fonction de blocage Worm,
  • Hitachi y ajoute des capacités de recherche sur le contenu dans les contrôleurs de noeud,
  • EMC, qui encapsule physiquement les archives et laisse aux applications le soin d'accéder aux données.
Conformité

Au départ, il ne s'agit que d'archivage et les différentes technologies proposent à la fois sécurité des données et faible coût à l'octet. Pour satisfaire aux contraintes de l'archivage légal, les constructeurs ont également ajouté un mode "légal" ou "compliance" qui permet de conserver au document archivé sa valeur probante. Ainsi, tous les systèmes répondent à leur manière à 4 exigences des législations :

  • sécurité :les systèmes RAID ou RAIN assurent une sécurité de fonctionnement qui peut-être complétée par une duplication délocalisée,
  • authenticité :le système doit garantir que le fichier n'a pas été volontairement ou involontairement modifié (à l'aide d'une signature, d'empreintes et d'horodatage),
  • traçabilité :l'ensemble des événements intervenus doit pouvoir être connu (interventions de l'administrateur, effacements sous contrôle,changements physiques de disques, de fuseau horaires, accès, tentatives de modification, alerte de rupture d'authentification périodique...)
  • auditabilite : le législateur impose au client une réactivité suite à une enquête.
    Certaines institutions comme la SEC impose même des formats d'écrans préformatés à remplir en cas de demande (type NASD)
SnapLock de NetApp

SnapLock est essentiellement un dispositif logique, permettant de "wormiser" n'importe quel support NetApp.  

Le système repose sur une horloge logicielle indépendante de la baie qui écrit sa mesure systématiquement sur les disques worm toutes les 10 secondes. Toutes les fonctions liées à la manipulation des fichiers worm sont validées par l'horloge.
Si jamais l'on remplace le contrôleur par un contrôleur d'une nouvelle armoire avec une nouvelle horloge et avec une autre mesure de temps; le logiciel s'en aperçoit et se recale.
Les disques sont de type raid, lors des manipulations, le contrôleur effectue un calcul de contrôle (CRC) et, en cas d'erreur, le segment est réécrit. Avec le Raid, les données sont cryptées et réparties, ce qui rend impossible la lecture ou la modification directe.
L'avantage de ce dispositif réside dans sa simplicité :

  • n'importe quel volume NetApp peut devenir un Worm d'archivage,
  • l'application n'a pas besoin d'une API pour accéder aux archives, il suffit d'y accéder comme un NAS (CIFS ou NFS).

Aujourd'hui, toutes les factures d'Orange ou de SFR sont archivées avec ce système.

HCAP d'Hitachi

Hitachi Data Systems propose HCAP (Hitachi Content Archive Platform), une architecture conçue pour s'intégrer à l'infrastructure de stockage existante et dont les noeuds embarquent une puissance de calcul sous Linux. 

La particularité de cette technologie est de proposer une capacité d'indexation et de recherche en texte intégral (full-text), standardisé ISO (XAM), sans API propriétaire, orientée "fond commun d'archive" et partageable entre différentes applications.

Centera d'EMC

Les baies d'archivage Centera d'EMC disposent également d'un mode Worm permettant de garantir l'intégrité des fichiers à conserver ("Compliance"). Physiquement, la sécurité des données est assurée par une technologie RAIN, pouvant être assimilé à du RAID, mais mettant en jeu de 2 à 7 noeuds différents selon le type. Contrairement à du RAID de disques classique le RAID de cellules d'archivage permet une répartition optimum de la charge de CPU et de la capacité utile. La régénération d'une copie certifiée conforme des éléments contenus sur un disque en panne est pris en charge par l'ensemble des noeuds. Le système peut rassembler des cellules de technologies ou de types différents.  

Le Centera scelle dans une enveloppe signée les données et les métadonnées. Une API permet aux applications d'accéder aux données. Cette API va permettre de stocker à la fois les données fournies par l'application et des métadonnées (éléments de preuve, qui a stocké, quand, calcul d'une empreinte unique par objet...). L'ensemble est scellé après horodatage et est confié à l'application. L'API utilisée a inspiré XAM (voir la fiche CAS). Elle est adoptée par les constructeurs et les éditeurs et sera compatible avec les documents déjà archivés sur Centera. Enfin, le Centera utilise l'adressage CAS (voir cette fiche) et apporte ainsi une excellente garantie sur l'authenticité des fichiers.
  
Merci pour leur aide dans la constitution de ce dossier à :
- Michel Alliel, responsables des produits et solutions chez HDS
- Roland Malbos, consultant senior chez EMC,
- Bruno Picard, manager chez NetApp

Dossiers dans la même thématique ...

Découverte des actifs de vos Datacenters : Une plus grande complexité exige une solution innovante Les équipes informatiques sont confrontées à des données plus nombreuses et à une plus grande complexité. Les environnements informatiques d’aujourd’hui ...

Réagir à cet article