Dans cette présentation, Hugues Cazeaux, fort de plus de 25 ans d’expérience et responsable au service informatique de l’Université de Genève, aborde la question de la préservation numérique au sein de l’institution.
Pour structurer son intervention, il propose trois grandes parties qui permettent d’explorer progressivement les enjeux et solutions mises en place à l’Université de Genève.
1. Le projet DLCM : une approche progressive vers l’archivage
Le premier volet est consacré au projet DLCM (Data Life Cycle Management), un programme national financé par Swiss Universities et déployé sur six ans en trois phases successives :
- Phase 1 (2015-2018) : Évaluation des solutions open source adaptées aux besoins d’archivage et de gestion des données.
- Phase 2 (2018-2020) : Développement et mise en place des solutions DLCM, conduisant à la création d’un nouveau service.
- Phase 3 (2021) : Lancement d’OLOS, une solution SaaS dédiée aux petites institutions dépourvues de service d’archivage, leur offrant un moyen efficace de conserver et de structurer leurs données.
2. L’impact des évolutions législatives sur l’archivage
Le second axe de la présentation aborde les projets de lois qui ont influencé les infrastructures de stockage et les services associés. L’objectif était d’optimiser l’accès et l’utilisation des données issues de la recherche au sein des hautes écoles universitaires genevoises. Ce projet, approuvé en 2017, a été déployé sur une durée de sept ans.
3. Yareta : une solution numérique pour l’archivage
Une partie importante de la présentation est dédiée à Yareta, une solution numérique basée sur des technologies open source et mise en place en 2019. Aujourd’hui, elle compte plus de 1 000 archives créées et plus de 15 To de données stockées.
Le développement de Yareta s’est appuyé sur les avancées du projet DLCM et le financement du Fonds National Suisse (FNS). En mars 2024, la solution a obtenu la certification CTS (Core Trust Seal), garantissant sa conformité aux bonnes pratiques de l’archivage numérique.
La stratégie de Yareta repose sur une accessibilité maximale, avec pour devise :
« Aussi ouvert que possible, autant fermé que nécessaire », en faveur du principe de l’open access.
4. Archivage administratif et patrimonial : répondre aux besoins spécifiques
L’archivage numérique ne concerne pas uniquement la recherche. Un travail a été mené pour identifier et répondre aux besoins de conservation des documents administratifs et patrimoniaux. L’évaluation a porté sur plusieurs critères :
- Les besoins d’archivage du Rectorat
- La numérisation des archives académiques
- La conservation des documents numérisés
- La modernisation des systèmes de catalogage des fonds d’archives
5. Hedera : structurer les données pour les humanités numériques
Lancé en 2024, Hedera s’inscrit dans une démarche visant à standardiser et homogénéiser les données en lien avec les humanités numériques.
Ce projet repose sur un processus structuré en plusieurs étapes :
- Transformation des métadonnées en RDF (Resource Description Framework).
- Consolidation des données grâce à une ontologie commune et partagée.
L’objectif est de rendre les données et métadonnées plus accessibles aux chercheurs et utilisateurs, en facilitant leur interopérabilité et leur exploitation.
Le défi principal réside dans l’introduction d’un nouveau format d’archivage, destiné à remplacer l’ancien standard Isad(G), afin d’améliorer la structuration et la pérennisation des archives numériques.
6. DNAMIC : l’archivage numérique via l’ADN
Enfin, le dernier volet de la présentation se concentre sur le projet DNAMIC, une initiative novatrice qui explore l’archivage des données dans de l’ADN.
L’idée est de développer un prototype permettant d’automatiser l’encodage, le stockage et le décodage des archives en utilisant une micro-factory et les avancées du projet DLCM.
Pourquoi utiliser l’ADN comme support de stockage ?
- Il offre une forte densité d’information dans un espace réduit.
- Il peut être conservé à température ambiante, réduisant ainsi les coûts énergétiques.
- Il permet une capacité de réplication, assurant une conservation durable des données.
À travers ces initiatives, l’Université de Genève démontre son engagement dans la préservation numérique, en s’appuyant sur des solutions innovantes adaptées aux besoins de la recherche, de l’administration et du patrimoine académique.
Dans cette présentation, Marion Ville, du programme Vitam, expose les outils utilisés au sein du réseau des archives publiques françaises pour faciliter la collecte et l’archivage des documents bureautiques.
1 – Le contexte des archives publiques en France
En France, l’archivage des documents produits par l’administration publique est encadré par un réseau structuré :
- Le Comité Interministériel des Archives de France définit les grandes orientations stratégiques en matière d’archives publiques.
- Le Service Interministériel des Archives de France (SIAF), rattaché au ministère de la Culture, assure la coordination et l’évaluation des actions de l’État en matière d’archivage, à l’exception des archives du ministère de l’Europe et des Affaires étrangères ainsi que de celles de l’armée, qui disposent de leur propre autonomie.
2 – Le programme Vitam
Le programme Vitam est un système d’archivage électronique financé par plusieurs ministères (Culture, Affaires étrangères, Armée). Il vise à structurer et moderniser la gestion des archives publiques en garantissant leur pérennité et leur accessibilité.
3 – Les défis de l’archivage électronique
Les services d’archives publiques rencontrent deux défis majeurs :
- Le traitement des données : Il est essentiel d’archiver et de retrouver rapidement les documents dans un volume d’informations croissant.
- Le versement des archives : Les documents archivés doivent respecter le standard SEDA (Standard d’Échange de Données pour l’Archivage) et être intégrés sous le format XML SEDA.
4 – Les outils d’archivage présentés
Archifiltre-Docs
Développé en 2019 par la Mission Archives des ministères sociaux, cet outil permet de visualiser et organiser les arborescences de fichiers. Il aide à trier, décrire, enrichir et identifier les documents éliminables avant leur archivage définitif.
ReSIP
Créé par le programme Vitam et disponible en Open Source, ReSIP permet d’importer, traiter et exporter des SIP (paquets d’informations soumis à l’archivage), offrant ainsi une solution avancée par rapport aux anciens outils qui servaient principalement à effectuer des tests.
Octave
Développé par le Service Interministériel des Archives de France, Octave facilite la constitution de versements d’archives bureautiques. Il est spécifiquement conçu pour répondre aux besoins des archives publiques territoriales.
5 – Démonstration et conclusion
La présentation se termine par une démonstration des trois outils en action, illustrant comment ils permettent de collecter, organiser et intégrer efficacement les archives publiques.
En conclusion, des solutions comme Archifiltre-Docs, ReSIP, Octave et d’autres outils d’archivage électronique permettent aux archivistes de répondre aux exigences réglementaires tout en respectant les standards en vigueur. Ces solutions offrent différentes approches adaptées aux besoins des professionnels de l’archivage.
Une genèse dans l’archivage réglementaire
Arcsys a vu le jour dans les années 1990 pour répondre à des exigences fiscales spécifiques, notamment le contrôle des données comptables. En 2004, le projet a pris un tournant décisif avec une ambition plus vaste : fournir une solution de préservation numérique couvrant à la fois des besoins réglementaires (factures, contrats) et patrimoniaux (thèses, cartes marines). Cette double vocation, mêlant conformité légale et valorisation des données, a marqué le début d’une aventure qui continue de se réinventer.
Des défis constants dans un environnement changeant
L’interopérabilité est rapidement devenue un enjeu majeur. Arcsys a dû s’adapter à un large éventail de technologies et de normes, tout en limitant les dépendances pour garantir sa pérennité. Par exemple, le logiciel a intégré des systèmes de stockage variés (disques, bandes, cloud) et des outils de sécurité sophistiqués, tout en maintenant sa compatibilité avec des solutions externes comme SharePoint ou SAP.
Les évolutions technologiques ont parfois contraint l’équipe à abandonner certaines briques logicielles devenues obsolètes, comme Solaris ou TSM. Ces ajustements nécessitaient un arbitrage constant pour rester aligné sur les besoins des clients et les normes du marché.
L’enjeu des performances et de la volumétrie
Face à des volumes d’archives en croissance exponentielle, le logiciel a évolué pour supporter des charges toujours plus importantes. Les besoins de performance, tels que la gestion de dizaines de millions de documents par jour ou des consultations à grande échelle, ont poussé à repenser l’architecture du produit. Une approche modulaire, basée sur des clusters, a permis de répartir les charges tout en garantissant fluidité et robustesse. Cependant, chaque fonctionnalité ajoutée, comme la compression ou la validation des formats, devait être soigneusement optimisée pour ne pas compromettre les performances globales.
Sécurité et pérennité : des priorités absolues
La sécurité des données est au cœur des préoccupations du produit, en particulier dans des secteurs sensibles comme le militaire ou l’aviation. Des mécanismes avancés de signature électronique et de scellement garantissent l’intégrité des archives. Cependant, les menaces croissantes en cybersécurité, illustrées par des incidents comme Log4Shell, ont nécessité la mise en place de plans d’action rigoureux. Ces protocoles incluent une surveillance continue des vulnérabilités et des correctifs rapides pour protéger les données des utilisateurs.
La pérennité est également un pilier fondamental. Le logiciel s’efforce de garantir une migration fluide des données à travers les évolutions technologiques, tout en assurant une transparence totale pour les clients. La réversibilité des données est un autre aspect clé, permettant aux utilisateurs de conserver leur autonomie, même en cas de défaillance de l’éditeur.
Vers un avenir durable et innovant
Tandis que la préservation numérique continue de gagner en importance, le logiciel se projette vers des évolutions qui allient innovation et sobriété. L’objectif est d’encourager une gestion raisonnée des données, en éliminant les archives inutiles pour limiter l’empreinte carbone. L’usine logicielle du produit sera également renforcée afin d’accélérer les mises à jour et répondre efficacement aux attentes des utilisateurs.
L’innovation demeurera prudente, avec une attention spéciale portée aux technologies émergentes comme la blockchain ou l’intelligence artificielle. Ces outils ne seront intégrés qu’après avoir garanti leur valeur ajoutée et leur durabilité.
Une collaboration nécessaire entre acteurs publics et privés
En conclusion, il y a une réelle importance de mettre en place une collaboration renforcée entre les acteurs publics, privés et académiques pour faire progresser la préservation numérique. Aucun système ne peut fonctionner de manière isolée ; il est essentiel d’approuver l’échange et le partage des connaissances pour répondre aux défis complexes de ce domaine. Arcsys représente parfaitement cette dynamique, en restant une solution accessible et en constante adaptation pour relever les enjeux de demain.
Chez Smals, une organisation belge consacrée aux services informatiques pour le secteur public, l’archivage numérique est devenu une solution déterminante pour répondre aux besoins croissants des institutions publiques. Cette présentation détaille la mise en place d’une plateforme mutualisée, les défis rencontrés, et les solutions techniques choisies pour gérer un volume croissant de données numériques.
Contexte de la mise en place de la plateforme
Le projet débute avec l’Office National de Sécurité Sociale (ONSS), une institution centrale en Belgique responsable de la gestion des déclarations sociales électroniques. Ces fichiers, générés sous format XML, représentent 100 millions d’échanges par an avec une croissance de 10 % chaque année.
Initialement, l’objectif était de réduire les coûts logistiques tout en assurant la sécurité juridique des déclarations. Cependant, l’accumulation massive de données depuis 2003 a imposé une réflexion sur une solution d’archivage plus robuste et centralisée.
Transition vers une plateforme mutualisée
En 2015, Smals amorce une transformation du projet initial, destiné à une seule institution, vers une plateforme partagée entre plusieurs institutions publiques. Ce modèle repose sur une infrastructure unique et des silos d’information permettant de préserver la confidentialité des données.
- En 2017, le projet passe en production avec l’ONSS comme premier client.
- D’autres institutions s’intègrent progressivement, avec actuellement 6 institutions connectées et 5 autres en cours d’intégration.
Aujourd’hui, la plateforme gère 480 millions d’objets archivés pour un total de 81 To de données, tout en continuant à évoluer.
Fonctionnalités principales de la plateforme
- Archivage probant et sécurisé : Les documents numériques, qu’ils soient des PDF, vidéos ou autres formats, sont archivés selon des normes rigoureuses.
- Multiclients et centralisation : Une seule infrastructure, partagée mais sécurisée, est ouverte aux institutions publiques fédérales et régionales.
- Consultation en ligne : Les archives sont accessibles directement via des portails publics ou des applications métier. Par exemple, les citoyens belges peuvent consulter leurs prévisions de pension ou leurs documents administratifs en ligne.
Cette fonctionnalité de consultation directe a permis de valoriser les archives, les rendant indispensables aux processus métiers tout en réduisant les coûts liés à la duplication des fichiers dans d’autres systèmes.
Défis techniques rencontrés
- Gestion des métadonnées :
- La définition et l’utilisation des métadonnées doivent équilibrer leur utilité et le coût qu’elles induisent.
- Un client initialement ambitieux a simplifié son modèle de 30 à 15 métadonnées génériques pour réduire la complexité.
- Migration de stockage :
- Le remplacement régulier des supports de stockage (tous les 5-6 ans) implique des migrations lourdes et coûteuses.
- La dernière migration a duré 18 mois, posant des défis en termes de planification et de ressources.
- Volumétrie et performances :
- L’identification des formats avec PRONOM a provoqué des ralentissements significatifs en production, surtout pour les fichiers compressés ou de grande taille.
- Le test de fonctionnalités sur de grandes volumétries reste complexe et onéreux.
Impact et bénéfices
- Optimisation des coûts : En réduisant les besoins de stockage redondant dans les systèmes métier, la plateforme est reconnue comme une solution d’économie énergétique.
- Soutien aux processus métiers : Les archives ne sont plus perçues comme un simple coût juridique, mais comme une ressource valorisée.
- Évolution continue : Le système est conçu pour s’adapter progressivement aux besoins croissants, tout en conservant une flexibilité pour intégrer de nouvelles institutions.
Conclusion de la présentation
La plateforme mutualisée développée par Smals montre comment une solution d’archivage électronique peut répondre aux besoins variés des institutions publiques tout en valorisant les archives pour des usages opérationnels. Grâce à une approche modulaire et évolutive, Smals a réussi à concilier exigences juridiques, contraintes techniques et ambitions économiques, offrant ainsi une solution pérenne et adaptable pour le secteur public belge.