On peut utiliser n'importe quel support pour archiver. Mais pour un "archivage légal", il est préférable d'utiliser un support non modifiable. Pour cette raison, les opérateurs ont d'abord tourné leur regard vers les supports optiques WORM (DON, CD, DVD...). Toutefois, plusieurs fabricants proposent désormais des baies de stockage à base de disques magnétiques conjuguant les avantages des disques magnétiques et la garantie de non réinscriptibilité. Examen de 3 philosophies, le SnapLock de NetApp, le HCAP d'Hitachi et le Centera d'EMC.
Pourquoi un Worm ?La législation n'apporte (heureusement) aucune précision sur les choix techniques susceptibles de répondre aux critères indispensables à un archivage légal. Toutefois, cette notion d'archivage légal impose que l'on s'assure que le document que l'on a conservé puisse être restitué en apportant l'assurance qu'il n'a pu être modifié. L'utilisation d'un support inscriptible une seule fois (WORM) est donc préconisée.
Mieux, la norme NF Z 42-013 n'accepte que les supports de type optique non-réinscriptible. Cette norme, rédigée en 1999 et mise à jour en 2001 doit être remise au goût du jour (on parle maintenant de fin 2007). Cependant, si l'obéissance à cette norme française est une piste à suivre, ce n'est pas la seule et l'unique. Les Worm logiques à base de disques magnétiques semblent pouvoir répondre aussi bien, voire mieux par certains aspects, aux exigences de ce type de conservation.
Au moins 4 avantages plaident pour l'emploi de disques magnétiques à la place des supports optiques :
Les différents systèmes de Worm logiques reposent sur des baies de stockage généralement désignées sous le terme CAS (Content Addressed Storage) - voir cette fiche. Les disques sont associés dans des dispositifs de type RAID (voir cette fiche). Les données sont automatiquement dupliquées pour pallier les pannes. En cas de panne, les disques sont échangeables à chaud. Les données sont reconstituées sur les nouveaux disques à partir des données stockées de manière redondante. Pour garantir que les fichiers ne sont pas altérés ou modifiés divers dispositifs ont été imaginés, tous basés sur le cryptage et la signature électronique (voir cette fiche). Les différents constructeurs proposent des concepts plutôt différents en terme d'architecture, et donc de caractéristiques. Les critères de différentiation sont :
Schématiquement, on pourrait discerner :
Au départ, il ne s'agit que d'archivage et les différentes technologies proposent à la fois sécurité des données et faible coût à l'octet. Pour satisfaire aux contraintes de l'archivage légal, les constructeurs ont également ajouté un mode "légal" ou "compliance" qui permet de conserver au document archivé sa valeur probante. Ainsi, tous les systèmes répondent à leur manière à 4 exigences des législations :
SnapLock est essentiellement un dispositif logique, permettant de "wormiser" n'importe quel support NetApp.
Le système repose sur une horloge logicielle indépendante de la baie qui écrit sa mesure systématiquement sur les disques worm toutes les 10 secondes. Toutes les fonctions liées à la manipulation des fichiers worm sont validées par l'horloge.
Si jamais l'on remplace le contrôleur par un contrôleur d'une nouvelle armoire avec une nouvelle horloge et avec une autre mesure de temps; le logiciel s'en aperçoit et se recale.
Les disques sont de type raid, lors des manipulations, le contrôleur effectue un calcul de contrôle (CRC) et, en cas d'erreur, le segment est réécrit. Avec le Raid, les données sont cryptées et réparties, ce qui rend impossible la lecture ou la modification directe.
L'avantage de ce dispositif réside dans sa simplicité :
Aujourd'hui, toutes les factures d'Orange ou de SFR sont archivées avec ce système.
HCAP d'HitachiHitachi Data Systems propose HCAP (Hitachi Content Archive Platform), une architecture conçue pour s'intégrer à l'infrastructure de stockage existante et dont les noeuds embarquent une puissance de calcul sous Linux.
La particularité de cette technologie est de proposer une capacité d'indexation et de recherche en texte intégral (full-text), standardisé ISO (XAM), sans API propriétaire, orientée "fond commun d'archive" et partageable entre différentes applications.
Centera d'EMCLes baies d'archivage Centera d'EMC disposent également d'un mode Worm permettant de garantir l'intégrité des fichiers à conserver ("Compliance"). Physiquement, la sécurité des données est assurée par une technologie RAIN, pouvant être assimilé à du RAID, mais mettant en jeu de 2 à 7 noeuds différents selon le type. Contrairement à du RAID de disques classique le RAID de cellules d'archivage permet une répartition optimum de la charge de CPU et de la capacité utile. La régénération d'une copie certifiée conforme des éléments contenus sur un disque en panne est pris en charge par l'ensemble des noeuds. Le système peut rassembler des cellules de technologies ou de types différents.
Le Centera scelle dans une enveloppe signée les données et les métadonnées. Une API permet aux applications d'accéder aux données. Cette API va permettre de stocker à la fois les données fournies par l'application et des métadonnées (éléments de preuve, qui a stocké, quand, calcul d'une empreinte unique par objet...). L'ensemble est scellé après horodatage et est confié à l'application. L'API utilisée a inspiré XAM (voir la fiche CAS). Elle est adoptée par les constructeurs et les éditeurs et sera compatible avec les documents déjà archivés sur Centera. Enfin, le Centera utilise l'adressage CAS (voir cette fiche) et apporte ainsi une excellente garantie sur l'authenticité des fichiers.
Merci pour leur aide dans la constitution de ce dossier à :
- Michel Alliel, responsables des produits et solutions chez HDS
- Roland Malbos, consultant senior chez EMC,
- Bruno Picard, manager chez NetApp