Archives 21 a un an…

Le comité de rédaction d’Archives 21 est heureux de souligner le premier anniversaire du blogue des enseignants en archivistique de l’École de bibliothéconomie et des sciences de l’information (EBSI) de l’Université de Montréal. Issu d’un projet du Comité local d’intégration pédagogique (CLIP), ce blogue vient de traverser sa première année. Comme vous le savez, il s’avère difficile de maintenir un blogue professionnel en activité. Pour un qui tient le coup, trois ou quatre tombent au combat. Archives 21 tient le cap avec un billet chaque quinzaine. Fort de ses 66 abonnés et de ses nombreux lecteurs étudiants et professionnels, nous comptons bien faire davantage en 2017-2018.

Le succès d’un blogue repose sur sa régularité et sur l’esprit de collaboration qui l’anime. À ce titre, le comité de rédaction remercie chaleureusement tous ses rédacteurs étudiants, chargés de cours et professeurs.

Les études, ça prend du temps !

FRANÇOIS CARTIER, chargé de cours
ISABELLE DION, chargé de cours et coordonnatrice des stages

 

Lorsque l’on est étudiant, la notion de temps devient une donnée essentielle. Lectures à faire avant le prochain cours, étude à faire pour l’examen intra ou bien rendez-vous à planifier avec les collègues pour cet interminable TP que vous demande le prof. Les étudiants manquent toujours de temps, mais  peut-être est-ce parce qu’ils connaissent mal le concept de « temps académique ».

Commençons par quelques chiffres tirés du règlement pédagogique des études de 1er cycle.  Le crédit est une unité de mesure qui sert à quantifier la charge de travail exigée pour un étudiant pour atteindre les objectifs d’un cours. Un crédit égale 45 heures de travail pour l’étudiant. Il peut s’agir de la présence en classe, de l’étude en prévision d’un examen, de la réalisation d’un travail de recherche, etc.  Comme la plupart des cours comptent trois crédits, c’est donc un total de 135 heures de travail qu’il faut investir dans un cours.  Comment répartir ces 135 heures au cours du trimestre ? Il y a les heures passées en classe bien sûr, mais également les heures de travail et d’études à la maison ou en laboratoire.  Il y a généralement 15 séances pour un cours (14 séances en classe + la semaine de lecture). L’étudiant doit donc prévoir 42 heures de présence en classe (14 séances x 3 heures). Il nous reste encore 93 heures de travail et d’études (135 heures – 42 heures en classe), soit environ six heures par semaine.

Comment gérer ces 93 heures ? Les enseignants vous offrent parfois une réponse en liant les évaluations et activités du cours à la charge de travail. Voici un exemple :

  • 42 heures de présence en classe
  • 20 heures de préparation aux examens
  • 40 heures pour la réalisation du travail pratique no 1
  • 20 heures pour la réalisation du travail pratique no 2
  • 10 heures pour les lectures obligatoires
  • 3 heures pour préparer et terminer un travail pratique au laboratoire d’informatique

      Total  = 135 heures

L’étudiant peut donc faire cet exercice en début de session, car il connait à l’avance la pondération pour chaque évaluation. Il est logique de consacrer plus de temps à un travail valant 50% qu’à un de 10%. Il connait aussi ses méthodes de travail qui lui permettront par exemple de consacrer moins temps à l’étude de ses examens, mais plus de temps aux lectures obligatoires.

Jusqu’à maintenant, nous n’avons évoqué que la gestion du temps pour un cours. Qu’en est-il lorsque l’étudiant a un statut à temps plein ? S’il est inscrit à cinq cours, eh bien, il faut multiplier ce temps par cinq ! Si nous examinons brièvement le temps sur une semaine, l’étudiant inscrit à cinq cours aura 15 heures de présence en classe (5 cours x 3 heures) et 30 heures de travail à réaliser en dehors des heures de classe (6 heures x 5 cours). Un total de 45 heures par semaine, c’est-à-dire l’équivalent d’un emploi à temps plein. À cette somme, il faut ajouter le cas échéant un emploi à temps partiel,  des activités sociales, une vie amoureuse et familiale, etc.

Au niveau de la planification du temps, les travaux en équipe représentent une situation problématique souvent évoquée par les étudiants. Pour toutes les équipes bien rodées, il y a les cas (heureusement isolés) où l’harmonie fait défaut. Notons tout d’abord que les travaux en équipe ne sont pas un moyen pour les enseignants d’avoir moins de corrections à faire ! Ceux qui vous donnent des cours (et des travaux !) bénéficient habituellement des services d’auxiliaires d’enseignement qui effectuent, entre autres, la correction des travaux et examens des étudiants. Les travaux en équipe sont une façon de vous amener à collaborer avec vos collègues afin de produire un résultat concret. Ce genre de situation se répétera plus tard dans votre milieu de travail, alors aussi bien apprendre le travail collaboratif sur les bancs d’école !

Travailler en équipe va donc vous demander de planifier votre temps de façon plus serrée. Non seulement devrez-vous gérer l’échéance de remise du travail, mais vous devrez fixer un échéancier dans votre propre équipe : Qui fait quoi ? Quand seront remises les différentes parties du travail ? Combien de temps se garder pour les imprévus ou la révision finale du travail avant la remise ? C’est une sorte de mini gestion de projet, un exercice que vous répéterez souvent par la suite en situation d’emploi.

Comme en milieu de travail, vos collègues étudiants arrivent chacun avec leurs personnalités : il y aura le perfectionniste qui argumente pour chaque virgule, son cousin le leader contrôlant qui prend tout en charge, le nonchalant qui produit sa part sans y mettre trop d’effort et celui qui ne répond plus à vos courriels et qui sèche les réunions de travail. Ceci dit, ce sont les exceptions, car la majorité de vos collègues sont tous aussi motivés que vous  et désirent produire le meilleur travail possible.

En équipe, pour bien gérer votre échéancier, voici quelques trucs :

  • Il est important de bien prendre connaissance du travail à effectuer et à le décortiquer afin d’identifier les tâches requises à sa réalisation :
    • lectures à faire
    • compilation de données ou d’informations
    • rédaction et révision
    • etc.
  • Ça semble évident, mais fixez clairement votre échéancier dès le début ; mettez-le sur papier, qui même à faire un petit diagramme de Gantt . Ce sera votre feuille de route de laquelle il faudra dévier le moins possible.
  • Déterminer, en fonction des forces et faiblesses de chacun, qui fera quoi.
  • Échanger vos coordonnées (téléphone, courriel) afin que tous soient joignables. La communication est un élément central dans votre démarche !
  • Faire un suivi régulier de l’avancée des travaux afin d’éviter que vous soyez pressés par le temps. Croyez-le, un travail fait à la dernière minute, ça se reconnaît facilement !
  • En cas de désaccord, articulez clairement vos arguments et faites-le dans un esprit de respect et de collégialité.
  • Lors de la remise, assurez-vous que tous les membres de l’équipe aient vu le produit final afin que tous soient en accord avec le contenu soumis dans le travail.

Bref, le travail en équipe représente un défi additionnel pour les étudiants, mais c’est aussi un apprentissage qui servira une fois le diplôme obtenu. C’est une expérience qui se veut formatrice, notamment dans la gestion du temps. Et rappelez-vous que même si tout ne fonctionne pas comme sur des roulettes, c’est un peu le reflet de ce qui pourra arriver en milieu de travail !

Enquête sur les archives des archives

WILLIAM YOAKIM, étudiant au doctorat
YVON LEMAY, professeur agrégé
CHRISTINE DUFOUR, professeure agrégée

Créer, évaluer, préserver, éliminer et exploiter des documents, telle est une partie des tâches effectuées quotidiennement par les archivistes du monde entier. Bien réalisées, ces actions contribuent à préserver la mémoire de familles, d’entreprises, de villes, de régions, de pays, et, d’une certaine manière, de l’humanité. Les archivistes doivent, afin de développer une rigueur de travail exemplaire, se doter de règles, mais également d’outils qui viendront les épauler dans l’accomplissement de leur mission. Dépositaires d’une science évoluant, s’adaptant et, parfois, subissant l’histoire des hommes, les responsables de services et de centres d’archives ne cessent de prodiguer aides et conseils aux créateurs de documents. Parmi ces recommandations, l’utilisation d’un plan de classification et d’un calendrier de conservation, permettant respectivement une meilleure identification et conservation de la production documentaire, est continuellement prônée. Quand ils sont bien réalisés, ces deux outils de gestion sont considérés comme constituant la base d’un traitement optimal et réfléchi des documents produits. Il n’est donc guère surprenant de voir Bibliothèque et Archives nationales du Québec (BAnQ) en faire la promotion auprès des organismes publics : « Avec le plan de classification, le calendrier de conservation constitue un des éléments de base de la saine gestion documentaire d’un organisme public. » (BAnQ, s. d.)

Face à ces recommandations du milieu archivistique, il est légitime et pertinent de se questionner sur la gestion des documents directement produits et/ou reçus par les services et centres d’archives. Les responsables de ces derniers utilisent-ils les mêmes outils qu’ils recommandent ? Comme le démontrent certains ouvrages consacrés à la gestion des centres d’archives, tels que Keeping Archives de l’Australian Society of Archivists (Ellis, 1993), ces derniers doivent continuellement gérer et produire de nombreux documents afin d’assurer une saine gestion de ceux dont ils ont la charge. Malheureusement, comme l’affirme Jacques Grimard dans La gestion d’un centre d’archives : Mélange en l’honneur de Robert Garon :

La gestion de l’information, des documents, des archives mêmes nécessaires au fonctionnement des institutions ou services d’archives ou de gestion des documents n’a pas fait l’objet de recherche ni de réflexion très poussée. (Gagnon-Arguin et Grimard, 2003, p. 123)

Ainsi, à la certitude quant à la quantité importante de documents produits et/ou reçus par les services et les centres d’archives, s’oppose une absence remarquée de la littérature secondaire sur ce sujet. Immanquablement vient alors la question de savoir si les services et centres d’archives assurent la préservation de leur patrimoine documentaire de manière aussi efficace que celle qu’ils prônent et mettent en place pour les autres producteurs de documents. Les archivistes du futur pourront-ils trouver suffisamment de ressources lorsqu’il s’agira de s’interroger sur la gestion des services et centres d’archives de la fin du XXe et début du XXIe siècle ?

C’est afin de répondre aux nombreuses interrogations relevées ci-dessus qu’une enquête exploratoire, ayant pour objectif de saisir et de décrire un domaine encore peu exploré dans la littérature (Fortin et Gagnon, 2016, p. 69), a été menée en 2016. Le but principal a été d’identifier le traitement des documents produits et/ou reçus par les services et les centres d’archives du Québec dans le cadre de leurs activités. Ces derniers utilisent-ils un plan de classification et/ou un calendrier de conservation regroupant de manière exhaustive leurs documents de gestion et de fonction ou d’exploitation ?

Grâce à un questionnaire auto-administré et en ligne, plus de quatre-vingt-dix (46) centres d’archives dans la liste des membres du Réseau des services d’archives du Québec (RAQ) ont été contactés et plus de 40% de ces derniers nous ont fourni des réponses complètes et exploitables. Elles révèlent que même si l’existence d’un plan de classification et d’un calendrier de conservation semble, d’un premier regard, être acquise pour la majorité des services et centres d’archives interrogées, ces outils ne sont pas sans lacune et indiquent un problème général de préservation des documents produits et/ou reçus par les services et centres d’archives du Québec.

La méthodologie de travail mise en place, mais également les nombreux résultats obtenus dans le cadre de cette enquête sont disponibles dans Papyrus, le dépôt institutionnel de l’Université de Montréal.

 

Sources consultées:

  • BAnQ. (s. d.). Calendrier de conservation.
  • Ellis, J. (dir.). (1993). Keeping archives. Victoria, Australie : D.W. Thorpe ; Australian Society of Archivists Inc.
  • Fortin, M.-F. et Gagnon, J. (dir.). (2016). Fondements et étapes du processus de recherche. Montréal, QC : Chenelière éducation.
  • Gagnon-Arguin, L. et Grimard, J. (dir.). (2003). La gestion d’un centre d’archives : mélanges en l’honneur de Robert Garon. Québec, QC : Presses de l’Université du Québec.

Un projet de mise à jour de la terminologie de base en sciences de l’information

DANIEL DUCHARME, chargé de cours

Au printemps 2017, des chargés de cours de l’EBSI soumettait un projet au Comité local d’intégration pédagogique (CLIP), projet qui consiste à étendre la compilation terminologique de base en archivistique (projet 2015) aux sciences de l’information. En fait, il s’agit d’une mise à jour de la terminologie réalisée dans les années 1990 et qui a été retirée du site de l’EBSI en 2002 en raison de sa désuétude. À nos yeux, il devenait important de mettre à jour cette terminologie pour mieux soutenir l’évolution des cours offerts dans les programmes de l’EBSI afin que ceux-ci reflètent bien l’évolution de la discipline et de la profession. Ainsi, ce projet permettra de compléter celui de 2015 qui n’avait ciblé que les cours en archivistique. Les responsables du projet sont Dominic Boisvert et moi-même, le signataire de ce billet.

À la fin du projet (janvier 2018) – et c’est le but que nous recherchons par sa réalisation -, l’EBSI disposera d’une terminologie en sciences de l’information sur laquelle tous les enseignants (chargés de cours et professeurs) pourront s’appuyer pour dispenser leur enseignement. Cette terminologie sera à jour et pourra constituer une référence incontournable pour les étudiants, les chargés de cours et les professeurs de l’EBSI. Par ailleurs, elle participera au rayonnement de l’École dans la francophonie grâce à sa double diffusion : téléchargement (PDF) et application Web.

Pour réaliser le projet, la participation des chargés de cours et professeurs de l’EBSI est essentielle. Cet automne, chacun d’eux sera invité à nous faire parvenir les termes clés, accompagnés de leurs définitions, qu’ils utilisent dans le cadre de leur enseignement. De notre côté, nous analyserons les plans de cours du certificat en gestion de l’information numérique et de la maîtrise en sciences de l’information, ceux du certificat en archivistique ayant été analysés en 2015. Une fois les termes retenus, nous comparerons les termes issus de cette analyse avec ceux que nous aurons envoyés les enseignants. Nous compléterons au besoin en consultant les ouvrages récents pour compiler les définitions et leurs équivalents anglais. Enfin, cette première compilation terminologique sera envoyée à tous les enseignants de l’EBSI pour fin de commentaires et de validation. Les correctifs seront apportés avant la diffusion de l’ouvrage en février 2018.

La terminologie en sciences de l’information sera diffusée sous la forme d’un fichier PDF qui sera remis aux étudiants à leur entrée à l’EBSI de même qu’aux enseignants. Elle sera également disponible – et c’est ici que cela devient plus intéressant – par une application open source accessible sur le site Web de l’EBSI. La version Web sera disponible tant aux étudiant(e)s et aux enseignant(e)s ainsi qu’à toute personne visitant le site Web de l’École de bibliothéconomie et des sciences de l’information, notamment les bibliothécaires, les documentalistes et les gestionnaires de systèmes d’information. Autre précision, la version Web sera conçue à partir de l’application open source TEMATRES.

Grâce à la participation de tous les enseignants, chargés de cours et professeurs confondus, cet outil terminologique constituera un point positif dans la voie de l’harmonisation et la normalisation de nos pratiques en sciences de l’information.

Pour consulter la section archivistique de la terminologie, veuillez suivre ce lien. Pour en savoir davantage, veuillez lire aussi le billet de Dominic Boisvert consacré à ce projet.

Qu’est-ce que le PIAF ?

CAROLINE BECKER, Webmestre et Directrice des opérations du PIAF
DIDIER GRANGE, Président du comité de pilotage du PIAF

Depuis plus de quinze ans, l’Association Internationale des Archives Francophones (AIAF), soutenue par ses partenaires financiers, pilote le Portail International Archivistique Francophone ou « PIAF ». Inauguré à Tunis en 2005 lors du Sommet Mondial de la Société de l’Information organisé par les Nations-Unies, il a été utilisé par plus de 96’000 personnes en 2016. Le PIAF est un espace virtuel de formation, d’information et d’échange. Il est dédié à l’archivistique, aux archives et aux archivistes. Ce site, ouvert à tous, gratuit et libre d’accès, présente une vision intégrée de l’archivistique francophone. Même si le site est en français, il est fréquenté par des archivistes d’un très grand nombre de pays en dehors de la Francophonie.

Le PIAF est composé de trois volets :

– Le volet « Se former » permet d’accéder à une formation en ligne, libre et gratuite. Il s’adresse en premier lieu aux professionnels isolés, qui n’ont pas accès à des cours de base ou de perfectionnement ni à la littérature professionnelle. Le PIAF constitue également une ressource bienvenue pour des personnes n’appartenant pas à la profession, qui souhaitent s’initier à la gestion des archives. Il est aussi utilisé dans le cadre de cours en archivistique dans de nombreuses universités et écoles spécialisées à travers le monde. Cette offre pédagogique est régulièrement actualisée et enrichie.

– Le second volet, intitulé « Se documenter », est constitué d’un ensemble de ressources documentaires destiné aux professionnels. L’idée est de leur offrir, à travers les différentes rubriques de cet espace, une boîte à outils de l’archiviste contemporain. Il comprend donc une bibliographie archivistique francophone exhaustive et unique en son genre. Il met à disposition des galeries de photographies et des films illustrant les différentes fonctions de l’archiviste (gestionnaire, conservateur, financier, lobbyiste, maître d’œuvre d’un projet architectural, informaticien, spécialiste de la communication et de l’évènementiel). Le blogue des actualités archivistiques francophones vient également souligner, par des exemples précis, les différentes facettes de ce métier. Il donne accès à une liste, en les recensant fiche par fiche dans un annuaire, de toutes les institutions d’archives francophones dans le monde. Il propose pour finir une webographie ou liens utiles vers des blogues d’archivistes francophones, des listes de discussions professionnelles, des revues archivistiques en ligne et des sites d’associations professionnelles. Cette boîte à outils proposera également d’ici peu des textes de références pédagogiques ainsi que des textes législatifs.

– Finalement, le PIAF met à disposition un outil de travail collaboratif et d’échange entre pairs, baptisé « E-pro » (pour « Espace professionnel »). E-pro est une plateforme sécurisée dont l’accès est limité aux seules personnes inscrites. Actuellement, plus de 1280 personnes participent à cet espace. Plus de 80 groupes de travail ont été créés autour de différents thèmes. Pour s’inscrire, il suffit d’en faire la demande sur le Portail. E Pro nous permet de fédérer une communauté de métier francophone autour du PIAF tout comme notre page Facebook, notre compte Twitter et notre lettre d’information bisannuelle le « Cri du PIAF ».

Au mois d’avril 2016, après des travaux conséquents, une nouvelle version du site a été lancée. Elle a été conçue pour être utilisable sur les tablettes et sur les smartphones. L’ergonomie est plus dynamique et la navigation plus fluide.

La principale transformation – et elle est de taille – qui s’impose aujourd’hui à tout archiviste, qu’il ait été formé au XXème ou au XXIème siècle, est la prolifération du numérique dans son champ d’activité. Dans cette nouvelle version du PIAF, nous avons renforcé notre offre dans ce domaine afin que tous les archivistes aient le moyen de se former à la gestion des documents numériques et aux nouvelles techniques de conservation.

Mais cette nouvelle version ne constitue qu’une étape dans le développement du site. Parmi les travaux en cours ou à venir, on peut noter la création probable d’un quatrième volet général, consacré à la recherche en archivistique. Deux modules, l’un consacré aux référentiels métiers et l’autre à la législation archivistique francophone, sont en cours de préparation.

L’avenir du PIAF dépend fortement du degré d’engagement tant des institutions qui le soutiennent que de celui des professionnels prêts à contribuer au projet. Il est donc de la responsabilité de notre communauté professionnelle dans son entier de faire en sorte que le PIAF continue sur sa lancée, en alliant qualité, solidarité et service à la communauté.

A ce titre, l’équipe du PIAF lance une grande enquête auprès des internautes, enseignants, étudiants férus d’archivistique, dont vous êtes, chers lecteurs d’Archives 21 ! L’objectif, au terme de cette enquête, est d’établir une liste des textes incontournables ou « fondamentaux » pour une bonne maîtrise du métier d’archiviste et/ou de l’archivistique. N’hésitez pas à collaborer en envoyant votre liste à Aïda Chebbi (aida.chebbi@umontreal.ca) dans « commentaires » de notre blogue ! Cette liste figurera dans une nouvelle rubrique du PIAF.

Insistons, pour terminer, sur le très vif succès remporté par le PIAF. Il n’a pas d’équivalent au niveau international. Il peut faire la fierté des archivistes francophones dont la réussite, à travers cette réalisation particulière, à bien des égards et sous des latitudes différentes, est enviée. Certainement peut-on considérer le PIAF comme un modèle, qui pourrait un jour inspirer d’autres communautés professionnelles, voire le Conseil International des Archives (ICA).

Boîte à outils portables : créer un bordereau de versement pour Bagger

DOMINIC BOISVERT, chargé de cours

 

Dans un billet précédent nous avons démontré qu’il est possible d’utiliser des applications portables pour générer un SIP. L’un des logiciels que nous avons utilisé était Bagger [1]. Bagger est développé par la Library of Congress des États-Unis et est livré avec quelques profils de métadonnées. Dans ce billet, nous verrons comment modifier les profils de métadonnées et même comment en créer un nouveau.

Bagger peut être utilisé à toutes les étapes de traitement d’archives numériques. Puisqu’un fichier produit par Bagger (un sac dans la terminologie du projet) n’est rien d’autre qu’un fichier compressé auquel sont ajoutés des métadonnées. Le fichier compressé contient l’ensemble des documents que vous avez sélectionnés, en conservant la structure hiérarchique, en plus d’un inventaire des fichiers avec leur somme de contrôle. Vous pouvez paramétrer Bagger pour choisir, entre autres, le format de compression, l’algorithme de la somme de contrôle et déterminer certaines informations d’identification du sac. C’est précisément le sujet de ce billet.

Dans le billet précédent, nous utilisions Bagger pour regrouper des documents numériques pour en faire le versement. Il serait aussi possible d’utiliser Bagger pour stocker des AIP (Archival information Package, les paquets d’information à archiver) et même au moment de diffuser le contenu d’un AIP sous forme de paquet d’information à diffuser (DIP).

L’un des avantages de Bagger est qu’il ajoute des métadonnées au fichier compressé. Une partie de ces métadonnées forme l’équivalent d’un bordereau de versement. Voyons comment modifier un profil de métadonnées pour qu’il réponde aux besoins de votre institution.

Lorsque vous lancez Bagger pour la première fois, celui-ci crée un répertoire « bagger » dans lequel sont copiés différents profils de métadonnées. Les profils de métadonnées sont en format JSON. Le « JSON » JavaScript Object Notation – Notation Objet issue de JavaScript) est un format léger d’échange de données. » [2] Il a l’avantage d’être facile à lire par l’humain et d’être extrêmement malléable.

L’un des profils est « other-project-profile.json ». Nous l’utiliserons comme canevas de départ. Je vous suggère de le copier et de le renommer « mon-profil.json ». Vous pourriez aussi simplement créer un fichier vide avec un éditeur de texte comme bloc-note ou Notepad++ ou atom.io (mon préféré).

Le profil de métadonnées contient des couples nom/valeur comme celui-ci :

« Send-To-Name » : { « requiredValue » : « Sandy Bostian » },

Ici, le nom est « Send-to-Name » et la valeur est « Sandy Bostian ». L’expression « requiredValue » réfère à la boite de saisie dans le logiciel Bagger. Il est aussi possible de rendre un couple nom/valeur obligatoire en ajoutant la ligne « fieldRequired : true ».

En inscrivant une valeur (ici, Sandy Bostian) dans le profil nous pouvons pré-remplir le bordereau ou donner un exemple au producteur.

Il s’agit maintenant de déterminer quels sont les couples nom/valeur dont vous avez besoin dans votre bordereau de versement. Si votre organisme possède déjà un bordereau de versement, vous devriez y puiser vos couples nom/valeur. Pour notre exemple, nous nous limiterons à six couples : (1) Identification du producteur, (2) Courriel du producteur, (3) Identifiant du versement, (4) Identification de l’OAIS, (5) Identification du protocole de versement, et (6) Identifiant du versement.

Le couple « Identification du producteur » permet d’identifier la personne ou l’organisme producteur du SIP.

Comme il s’agit d’une information importante, nous la rendrons obligatoire. Et pour aider notre producteur nous ajouterons « Votre nom ou celui de votre institution » pour l’informer qu’il doit s’identifier.

« Identification du producteur » : {
« fieldRequired » : true, « requiredValue » : « Votre nom ou celui de votre institution »
},

Le couple « Courriel du producteur » permet de documenter au moins un moyen de communication avec le producteur. Comme cette information est aussi disponible ailleurs nous la laisserons facultative.

« Courriel du producteur » : {
« requiredValue » : «  »
},

Le couple « Identifiant du versement » permet de repérer le versement parmi d’autres fait par le même producteur.

« Identifiant du versement » : { « fieldRequired » : true, « requiredValue » : « Identifiant donnée par le producteur »},

Ici, vous identifiez votre institution.

« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},

Le couple « Identification du protocole de versement » permet de documenter le numéro ou un autre identifiant du protocole de versement signé entre le producteur et votre organisme.

« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »
},

Notre dernier couple identifie le versement dans le système de gestion des archives de votre organisme.

« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}

Le fichier complet :

{
« Identification du producteur » :
{
« fieldRequired » : true, « requiredValue » :
« ACME »
},
« Courriel du producteur » : {
« requiredValue » :  »
},
« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant donnée par le producteur »
},
« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},
« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »},
« Identifiant du versement » :
{ « fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}
}

Attention à respecter l’écriture JSON. S’il y a plus d’un élément dans un couple nom/valeur il faut mettre une virgule entre les éléments (à la fin des lignes dans notre exemple), sauf au dernier. Les indentations ne sont pas obligatoires et ne servent qu’à faciliter la lecture. Chaque couple nom/valeur pourrait être sur une seule ligne mais cela alourdi la lecture.

Voilà, vous avez maintenant un profil de métadonnées JSON compatible avec Bagger et les besoins de votre organisme. Au prochain démarrage de Bagger, votre profil sera disponible dans la liste des profils.

Notes

[1] https://github.com/LibraryOfCongress/bagger

[2] http://w w w.JSON.org/JSON-fr.html

Boîte à outils portables : logiciels nécessaires à la création d’un SIP

DOMINIC BOISVERT, chargé de cours

« Oui, mais on fait quoi lorsque notre organisme est trop petit ou n’a pas les moyens d’acheter ou même d’installer un logiciel libre pour gérer les dépôts ou les versements de documents numériques ? »

Cette question, les étudiants qui suivent le cours Gestion des archives numériques (ARV3054) me la posent régulièrement. En toute légitimité, ils veulent savoir s’il est possible créer un SIP ou un AIP (Administration Information Package) sans logiciel de type serveur comme Archivematica ? Eh bien, oui, c’est possible… mais, pour ce faire, ils devront utiliser des logiciels libres qui ne nécessitent pas d’installation et adopter une procédure qu’ils suivront avec assiduité.

Et c’est justement l’objet de ce billet : l’identification des logiciels nécessaires à la création d’un SIP (System Information Package). [1]

LES LOGICIELS POUR CRÉER UN SIP

D’abord, qu’est-ce qu’un SIP ? Le SIP est le paquet d’information à archiver du modèle OAIS (Open Archives Information System). Il s’agit ni plus ni moins qu’un projet de dépôt ou de versement de documents d’archives numériques.

Voici les logiciels que nous utiliserons pour réaliser notre SIP :

  • 7zip, pour décompresser les fichiers existants, si nécessaire ;
  • ClamAV, pour s’assurer de ne pas archiver de virus ;
  • DROID, pour identifier les fichiers qui nous voulons archiver [2] ;
  • Bagger, pour faire le sac du SIP [2].

Une fois les logiciels téléchargés, veuillez les copier sur une clé USB en ayant soin de renommer les répertoires des logiciels ainsi :

  • 01_7zip
  • 02_ClamAV
  • 03_DROID
  • 04_Bagger

Comme vous l’aurez sans doute deviné, les chiffres précédés de la barre de soulignement représentent l’ordre d’exécution des logiciels dans notre procédure de création d’un SIP.

Vous vous demandez peut-être pourquoi nous recommandons de copier les logiciels sur un clé USB ? En effet, vous pourriez très bien les installer sur votre poste de travail. Par contre, vous pourriez être appelé à vous déplacer chez les producteurs et devoir alors travailler sur les postes de ceux-ci. Il arrive aussi que l’archiviste ou le producteur n’ait pas les privilèges nécessaires pour installer des logiciels sur leurs ordinateurs. Voilà pourquoi les applications portables vous permettront de travailler sans laisser de traces sur l’ordinateur du producteur.

LA PROCÉDURE POUR CRÉER UN SIP

Les logiciels sont tous présents sur la clé USB et les répertoires sont identifiés avec le numéro de l’étape d’utilisation.

Étape 0 : Créez un répertoire de travail temporaire que vous nommerez « SIP_AAAA-MM-JJ ».

Étape 1 : Déplacez les dossiers et les documents à traiter dans le répertoire de travail temporaire. Si nécessaire, décompressez les dossiers à traiter pour créer votre SIP avec 7zip ou le logiciel de décompression intégré dans le système d’exploitation de l’ordinateur.

Étape 2 : Démarrez ClamAV en vous assurant de mettre à jour la base de données de l’anti-virus. Puis, analysez le répertoire de travail temporaire.

  • Si ClamAV vous indique que tout va bien, fermez ClamAV et passez à l’étape 3.
  • Si ClamAV découvre un fichier infecté par un virus, alors isolez ce fichier en le plaçant dans un répertoire de quarantaine en prenant soin de ne pas l’inclure dans les étapes suivantes. Passer à l’étape 3.

Étape 3 : Démarrez DROID en vous assurant de mettre à jour la base de données des formats de fichiers. Puis, analysez le répertoire de travail temporaire. Ensuite, sauvegardez le résultat de l’analyse dans le répertoire de travail temporaire sous le nom « SIP_AAAA-MM-JJ_DROID.csv ». Fermez DROID.

Étape 4 :  Démarrez Bagger et créez un sac en format zip. Ajoutez les métadonnées nécessaires au traitement du SIP, puis enregistrez le sac en le nommant : « SIP_AAAA-MM-JJ.zip »

Étape 5. Après vous être assuré que le fichier SIP_AAAA-MM-JJ.zip est complet (vous pouvez l’analyser avec Bagger), vous devez supprimer le répertoire de travail temporaire.

Ajoutez un élément distinctif à la fin du nom de vos SIP si vous devez créer plus d’un SIP dans la même journée. Cet élément peut identifier le producteur ou être simplement un numéro séquentiel (l’identification du producteur est déjà l’une des métadonnées de votre sac Bagger).

Vous pourriez sauter l’étape 3 avec DROID et ne faire l’analyse des formats de fichiers que lors du traitement du SIP pour en faire un AIP. Personnellement, je préfère réaliser l’analyse immédiatement pour exclure certains types de fichiers (les fichiers temporaires, par exemple).

CONCLUSION

La gestion des archives numériques sans suite logicielle s’avère possible. Il suffit d’établir nos objectifs et de dénicher les logiciels qui nous permettront de les atteindre une étape à la fois.

Dans un prochain billet, nous verrons comment paramétrer Bagger pour que les métadonnées du sac reflètent les informations de votre bordereau de dépôt ou de versement.

Notes

[1] Ce billet de blogue s’inspire librement d’un article intitulé Practical Digital Preservation: In-House Solutions to Digital Preservation for Small Institutions de Tyller McNally.

[1] Les logiciels DROID et Bagger nécessitent l’installation de  JAVA. Vous pouvez utiliser la version Jportable si JAVA n’est pas installé sur l’ordinateur à partir duquel vous exécuterez la procédure.

Archives-moi : un réseau social dédié à la diffusion des archives

DANIEL DUCHARME, chargé de cours

Simon Côté-Lapointe : Création inspirée du mouvement Dada créé à partir d’archives. Exemple d’un remix diffusé sur Archives-moi.

Archives-moi est une initiative de deux jeunes archivistes qui ont pris la décision de ne pas attendre après l’État pour s’occuper des documents patrimoniaux des citoyens. Certes, d’autres services d’archives, comme Archives Passe-Mémoire (APM), notamment, jouent aussi ce rôle en acquérant, traitant, conservant et diffusant les écrits personnels de citoyens qui ont traversé l’existence sans nécessairement occuper une position de prestige dans l’échiquier sociétal. Mais APN procède à l’ancienne en ne collectant que des écrits majoritairement – pour ne pas dire exclusivement – sous forme papier. Cela ne leur enlève rien, remarquez, car leurs archives sont anciennes aussi, et cela a l’avantage de leur permettre de les diffuser. Comme on sait, les écrits personnels regorgent de données à caractère personnel, justement… et, en tant qu’archivistes, il est de notre devoir de les protéger. Et je n’aborderai même pas la question du droit d’auteur qui complique davantage les choses…

Bref, APN joue un rôle essentiel dans la préservation de la mémoire intime de certains Québécois, mais Archives-moi adopte une autre approche, une approche davantage dans l’ère du temps, plus ludique, plus conviviale, moins axée sur la conservation, davantage sur la diffusion. Le projet consiste à élaborer une plateforme collaborative dédiée à la diffusion des archives, un lieu virtuel où tout un chacun pourra y déposer ses archives personnelles numériques et/ou numérisées. On aura compris que l’enjeu n’est pas la conservation du patrimoine (encore que…) mais plutôt sa diffusion à grande échelle sur les réseaux sociaux. D’ailleurs, Priscilla Boisvert et Michel Carrière, les instigateurs du projet, n’hésitent pas à parler de leur application comme d’un « futur réseau social des nostalgiques ».

Les deux jeunes archivistes (dont l’un d’entre eux a étudié à l’EBSI) sont à la recherche d’un financement participatif et, pour ce faire, ont lancé une campagne sur Kickstarter. Ils ont besoin d’un coup de pouce de la part de la communauté. C’est donc le moment ou jamais de démontrer votre intérêt pour les archives autrement que par de vaines paroles qui ne passeront pas à l’histoire… Allez leur donner un coup de pouce en participant au financement du projet ! Pour ce faire, suivez les liens ci-dessous:

L’archivage de données au moyen de l’ADN : deuxième partie

MICHEL CHARTIER, étudiant

Ce texte est d’une version modifée d’un travail a été réalisé à l’EBSI, Université de Montréal, dans le cadre du cours ARV1050 – Introduction à l’archivistique donné au trimestre d’automne 2016 par Daniel Ducharme.

Dans un billet précédent, nous avons posé la problématique de la conservation des documents en soulignant la possibilité de recourir à l’ADN comme moyen éventuel de conservation. Dans ce billet, sans aller trop loin dans les détails, nous présenterons, en ordre chronologique, quelques-unes des méthodes qui ont été élaborées dans le but de consigner de l’information au moyen d’ADN.

Clelland et collègues (1999)

Cette première méthode n’a pas été mise au point dans le but d’archiver des données. Il s’agit néanmoins de l’une des premières à utiliser de l’ADN pour coder des messages (l’information), et c’est pourquoi nous l’abordons ici.

Selon Clelland, Risca et Bancroft (1999), elle s’inspire de la stéganographie, technique développée par le professeur Zapp et utilisée durant la Deuxième Guerre mondiale par les espions allemands pour transmettre des messages secrets. Elle consistait à photographier une page dactylographiée, à réduire considérablement la photo pour ainsi obtenir un « micropoint », puis à coller celui-ci sur un point (signe de ponctuation) dans une lettre anodine.

Ces chercheurs ont utilisé la technique stéganographique pour coder un message de type textuel dans un échantillon d’ADN et pour dissimuler ce dernier dans un micropoint. Le message est codé dans un brin d’ADN au moyen d’une clé de chiffrement, où les lettres de l’alphabet, les nombres de 1 à 9 et certains signes de ponctuation correspondent chacun à un triplet de bases azotées distinct (p. ex., A=CGA, B=CCA et ainsi de suite). Le message est associé à des séquences d’amorces, lesquelles servent à synthétiser le brin complémentaire d’ADN, et donc à « lire » le message. Une minuscule gouttelette de solution contenant 225 nanogrammes d’ADN humain, y compris le brin contenant le message caché, est ensuite versée sur un point imprimé sur du papier filtre. Dans cette expérience, des micropoints produits de cette manière ont été fixés à des points dans une lettre, puis celle-ci a été envoyée par l’entremise des services postaux des États-Unis. Le destinataire, qui connaissait au préalable les séquences d’amorces utilisées et détenait la clé de chiffrement, a fait appel à la technique d’amplification en chaîne par polymérase (PCR) pour amplifier l’ADN, ce qui lui a permis de lire et de décoder le message suivant, qui se voulait un clin d’œil à l’Histoire : « June 6 invasion: Normandy ».

Pour nous, l’intérêt de cette méthode réside dans le fait qu’elle a montré qu’il était possible de consigner de l’information de type alphanumérique sous forme d’ADN.

Il convient de mentionner que deux de ces chercheurs, en collaboration avec d’autres collègues, ont amélioré la technique en vue de l’utiliser comme moyen d’archivage en bonne et due forme (Bancroft, Bowler, Bloom et Clelland, 2001). La manière de coder de l’information (texte ou autre) dans l’ADN est semblable à celle utilisée dans la technique des micropoints, mais de nouveaux concepts sont introduits : l’ADN contenant l’information consignée est surnommé ADNi, et une « clé » constituée de multiples amorces sert à décoder l’information en question. Les techniques de la PCR et du séquençage permettent d’amplifier et d’analyser les séquences d’ADN en vue d’y extraire l’information. En outre, les chercheurs entrevoient la possibilité de conserver jusqu’à plusieurs milliers d’échantillons d’ADNi dans de petits dispositifs appelés microréseaux, ou puces à ADN, de la taille d’un timbre-poste, dont la capacité d’archivage équivaudrait à plusieurs dizaines de livres de type roman.

Ailenberg et Rotstein (2009)

Ces chercheurs sont parvenus à consigner divers types de données dans de l’ADN en utilisant tous les caractères présents sur un clavier d’ordinateur standard, ce qui ouvre davantage de possibilités comparativement à la technique précédente. Le codage de l’information repose ici aussi sur l’attribution de bases azotées à chaque caractère. Chaque caractère possède son propre « code » (appelé « codon » par les auteurs), qui correspond à un segment de la molécule d’ADN constitué d’un nombre et d’un ordre précis de bases azotées. Pour définir les codons, les chercheurs se sont inspirés de la méthode dite « de Huffman », laquelle a été mise au point par un chercheur du même nom dans le but de construire des codes composés de texte chiffré à l’aide d’un nombre minimal de symboles (voir Smith, Fiddes, Hawkins et Cox, 2003), permettant ainsi de simplifier le plus possible le codage des données. À leur tour, les codons d’ADN sont associés à des amorces spécialement conçues en vue de réduire la possibilité d’erreurs et d’accroître l’efficacité lors de la « lecture » de l’information consignée sur support ADN. Bien entendu, cette technique repose sur toute une série de manipulations en laboratoire, et de multiples produits et dispositifs sont nécessaires pour synthétiser l’ADN en question, mais les auteurs insistent sur le fait que l’extraction de l’information peut être réalisée de manière automatisée.

Grâce à cette technique, et en définissant des règles pour chaque type de données, Ailenberg et Rotstein ont pu synthétiser de l’ADN contenant une partie du texte de la comptine Mary had a little lamb et les notes de musique correspondantes. Ils ont aussi codé une « image », c’est-à-dire des coordonnées qui, lorsque décodées et transposées sur un diagramme bidimensionnel, permettent de recréer au moyen de formes géométriques très simples (cercles, rectangles, lignes) l’agneau de Mary.

Goldman et collègues (2013)

Grâce à la méthode qu’ils ont mise au point, Goldman et coll. (2013) ont pu consigner une quantité d’information beaucoup plus élevée que dans le cas des autres techniques élaborées jusqu’alors. Le codage des données s’effectue essentiellement en trois étapes. L’information est d’abord convertie sous forme numérique, soit en code binaire. Celui-ci est ensuite converti mathématiquement selon un système ternaire (0, 1 et 2) qui remplace chaque octet (ou caractère) par un « trit » composés de cinq ou six chiffres. Enfin, un appareil permet de synthétiser des chaînes d’ADN dans lesquelles chaque trit est remplacé par l’un des trois nucléotides qui diffèrent de celui utilisé pour le trit précédent. Bref, la procédure est assez complexe, quoique les résultats obtenus par ces chercheurs soient prometteurs.

Goldman et ses collègues ont mis leur méthode à l’essai en codant l’information tirée de cinq fichiers informatiques de formats différents (ASCII, PDF, JPEG et MP3), dont les 154 sonnets de Shakespeare et un court extrait du fameux discours de Martin Luther King intitulé « I have a dream », dans des chaînes d’ADN synthétique. Au total, ils ont consigné l’équivalent de 739 kilo-octets de données réparties dans plus de 153 000 chaînes d’ADN, chacune comportant 117 nucléotides. Fait notable, ils ont réussi à séquencer les morceaux d’ADN et à reconstituer le contenu des fichiers d’origine sans qu’aucune erreur ne s’y insère. Les chercheurs indiquent également que leur méthode pourrait, en théorie, servir à l’archivage de données à grande échelle et à long terme.

Il importe de souligner que les techniques présentées dans le présent travail (de même que celles que nous n’avons pas abordées) ne peuvent, pour le moment, être mises en œuvre de manière concrète, et ce, pour diverses raisons. D’une part, les coûts associés à la synthèse de l’ADN sont encore très élevés (Extance, 2016). D’autre part, la technologie actuelle ne permet pas de synthétiser de l’ADN à une échelle et à une vitesse suffisamment grandes pour concurrencer les méthodes d’archivage numérique existantes (par exemple, les supports magnétiques et optiques). Mais les acteurs de ce domaine de recherche semblent optimistes; le savoir et les technologies évoluent rapidement, de sorte que l’archivage de données sur support ADN pourrait être une pratique courante dans un avenir pas si lointain.

Conclusion : incidence sur la pratique archivistique

Si elles étaient adoptées, quelles pourraient être les répercussions de ces méthodes sur la pratique archivistique? Les futurs archivistes seraient-ils appelés à devenir des spécialistes de la biologie moléculaire afin de pouvoir maîtriser les concepts et les techniques qui sous-tendent la consignation d’information sur support ADN ?

Au fil du temps, les archivistes ont dû adapter leurs pratiques et acquérir de nouvelles connaissances et habiletés en fonction, notamment, de l’évolution des supports documentaires. À cet égard, le dernier siècle a été particulièrement mouvementé, si l’on peut dire, puisqu’il a vu l’apparition des premiers ordinateurs, puis le développement rapide de l’informatique et des outils technologiques connexes. Ces nouveaux moyens, qui permettent à la fois de produire et de consigner de l’information, ont bouleversé le travail des archivistes. Ceux-ci ont ainsi eu à se familiariser avec ces technologies et en sont venus à les utiliser à leur avantage dans le cadre de leurs activités.

Rien n’indique que, si les méthodes susmentionnées en venaient à s’imposer pour l’archivage et la conservation à long terme des données, les archivistes ne seraient pas en mesure de s’y adapter. Peut-être que des archivistes spécialisés seraient formés en vue du traitement approprié de l’information consignée sur support ADN. Du point de vue strictement pratique, le codage des données sous forme d’ADN faisant appel à des procédures largement (voire entièrement) automatisées, les archivistes seraient surtout amenés à mettre leurs connaissances technologiques à niveau, les dispositifs utilisés pouvant s’apparenter à des ordinateurs conçus pour accomplir des tâches très précises. À cette mise à niveau pourrait s’ajouter une formation visant à inculquer la théorie et les concepts fondamentaux de la biologie moléculaire. Est-il réaliste de penser que les archivistes pourront tirer profit de ces éventuelles méthodes d’archivage de l’information? Les archivistes modernes portent déjà plusieurs chapeaux : ils sont à la fois historiens, gestionnaires, informaticiens (etc.) ou, du moins, possèdent certaines des compétences propres à ces spécialités. À la lumière de ce constat, c’est par l’affirmative que nous répondons à cette question.

Sources consultées

  • ADN. (2012). Dans Encyclopédie de l’Agora. Repéré à http://agora.qc.ca/dossiers/ADN
  • Ailenberg, M. et Rotstein, O. D. (2009). An improved Huffman coding method for archiving text, images, and music characters in DNA. BioTechniques, 47(3), 747-754.
  • Bancroft, C., Bowler, T., Bloom, B. et Clelland, C. T. (2001). Long-Term Storage of Information in DNA. Science, 293(5536), 1763-1765.
  • Church, G. M., Gao, Y. et Kosuri, S. (2012). Next-Generation Digital Information Storage in DNA. Science, 337(6102), 1628.
  • Clelland, C. T., Risca, V. et Bancroft, C. (1999). Hiding messages in DNA microdots. Nature, 399(6736), 533-534.
  • Conway, P. (1996). Preservation in the Digital World (Publication no 62). Repéré sur le site du Council on Library and Information Resources : https://www.clir.org/pubs/reports/reports/conway2/index.html
  • Cox, J. P. L. (2001). Long-term data storage in DNA. Trends in Biotechnology, 19(7), 247-250.
  • Eternal 5D data storage could record the history of humankind. (2016). Repéré à http://www.southampton.ac.uk/news/2016/02/5d-data-storage-update.page
  • Exaoctet. (2000). Dans Le grand dictionnaire terminologique. Repéré à http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8873628
  • Extance, A. (2016). Digital DNA – Could the molecule known for storing genetic information also store the world’s data? Nature, 537(7618), 22-24.
  • Goldman, N., Bertone, P., Chen, S., Dessimoz, C., LeProust, E. M., Sipos, B. et Birney, E. (2013). Towards practical, high-capacity, low-maintenance information storage in synthesized DNA. Nature, 494(7435), 77-80.
  • Numérique. (2003). Dans Le grand dictionnaire terminologique. Repéré à http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8360889
  • Qu’est-ce que l’ADN? (s. d.). Repéré à http://www.lps.ens.fr/recherche/biophysique-ADN/dna1.html#rappels
  • Smith, G. C., Fiddes, C. C., Hawkins, J. P. et Cox, J. P. L. (2003). Some possible codes for encrypting data in DNA. Biotechnology Letters, 25(14), 1125-1130.
  • Un disque de verre pour stocker les données pour l’éternité (ou presque). (2016). Repéré à http://www.liberation.fr/futurs/2016/02/21/un-disque-de-verre-pour-stocker-les-donnees-pour-l-eternite-ou-presque_1434895
  • Waters, D. et Garrett, J. (1996). Preserving Digital Information : Report of the Task Force on Archiving of Digital Information. Washington, DC : The Commission on Preservation and Access.

L’archivage de données au moyen de l’ADN : première partie

MICHEL CHARTIER, étudiant

Ce texte est d’une version modifée d’un travail a été réalisé à l’EBSI, Université de Montréal, dans le cadre du cours ARV1050 – Introduction à l’archivistique donné au trimestre d’automne 2016 par Daniel Ducharme.

L’enjeu de la conservation

Pendant de nombreux siècles, et après avoir succédé à d’autres matières, le papier a été le principal support utilisé pour la consignation de l’information (surtout sous forme de texte, mais aussi d’images). Au papier se sont ajoutés, depuis le 19e siècle, d’autres supports, l’évolution de la technologie ayant permis de développer de nouvelles façons d’obtenir, puis de consigner l’information (par exemple, sous forme d’enregistrements sonores ou vidéo). Cette évolution s’est accélérée et a mené, dans la deuxième moitié du 20e siècle, à la création de techniques dites numériques, soit celles permettant « la production, le stockage et le traitement d’informations sous forme binaire » [c’est-à-dire des 1 et des 0] (Numérique, 2003). On parle souvent, dans ce contexte, de « révolution numérique », l’avènement de ces techniques ayant entraîné des changements importants et durables dans plusieurs aspects de la vie quotidienne, tant à l’échelle individuelle qu’à l’échelle sociétale. Au cours de l’Histoire, les archivistes, qui ont été des témoins privilégiés de l’évolution des documents, ont vu leur rôle évoluer en fonction de l’accroissement de la masse d’information produite par les individus et les organisations et de la diversification des supports utilisés pour la consigner.

L’accroissement exponentiel de l’information générée par les activités humaines et la diversification des supports créent par ailleurs un paradoxe des plus intéressants : tandis que notre capacité de consigner l’information s’est accrue avec le temps, la longévité des supports utilisés pour la conserver tend à diminuer (Conway, 1996; dans cet article, l’auteur qualifie cette situation de « dilemme », mais nous sommes d’avis que le terme « paradoxe » la décrit plus correctement). Ainsi, l’enjeu de la conservation à long terme de l’information consignée, qui concerne tous les types de supports documentaires, se pose avec encore plus d’acuité dans le cas des documents numériques. Bien qu’ils offrent l’avantage de pouvoir contenir de vastes quantités de données, les supports numériques présentent aussi plusieurs désavantages, dont les suivants : ils sont caractérisés par leur fragilité et par l’obsolescence rapide des technologies (matériel, logiciels) utilisées pour y consigner l’information (Waters et Garrett, 1996).

Afin de contourner les difficultés associées aux supports numériques, des chercheurs ont tenté de mettre au point des solutions de rechange plus stables qui offrent des capacités d’archivage de données exceptionnelles tout en assurant la conservation à très long terme de ces mêmes données. La dernière en date est celle consistant à archiver des données pentadimensionnelles (5D) dans un petit disque de verre nanostructuré de la taille d’une pièce de monnaie (Eternal 5D data storage, 2016). Cette technique, développée par des chercheurs de l’université de Southampton (Royaume-Uni), fait appel à un laser à impulsions ultracourtes pour la gravure des données à même le verre. Chaque disque a une capacité de stockage de 360 téraoctets (soit 3000 fois la capacité d’un disque Blu-Ray. Un disque de verre pour stocker les données peut résister à des températures allant jusqu’à 1000 °C et a une durée de vie théorique de 13,8 milliards d’années à une température ne dépassant pas 190 °C. De l’avis des chercheurs, cette technologie pourrait être fort utile aux organisations détenant de vastes archives, pourvu bien sûr qu’elles aient accès à l’équipement nécessaire pour la gravure (laser) et la lecture (microscope optique et polariseur) des disques.

L’une des autres solutions mises à l’essai fait l’objet du présent travail : il s’agit de l’archivage de données à l’aide d’acide désoxyribonucléique, mieux connu par son sigle : ADN.

L’ADN, support de l’information génétique

L’ADN est une molécule que l’on retrouve dans les cellules de tous les êtres vivants. On peut la représenter, d’une manière extrêmement simplifiée, sous la forme d’une échelle : les montants de l’échelle correspondent aux deux brins parallèles de la molécule d’ADN, et chaque barreau correspond à deux bases azotées liées l’une à l’autre (Encyclopédie de l’Agora, 2012; voir la figure 1). Les deux brins de cette « échelle » s’enroulent l’un autour de l’autre; la structure torsadée qui en résulte est dite « en double hélice » (Qu’est-ce que l’ADN?, s. d.). Chaque moitié de l’échelle est composée d’une succession d’éléments appelés nucléotides. Le nucléotide est constitué à son tour d’un groupement phosphate, d’un glucide et d’une base azotée (celle-ci formant l’une des deux moitiés d’un « barreau ») (Encyclopédie de l’Agora, 2012). On dénombre quatre bases azotées, soit l’adénine (A), la cytosine (C), la guanine (G) et la thymine (T), A s’appariant toujours avec T, et C avec G. Ces paires de bases azotées assurent la complémentarité des deux moitiés de la molécule d’ADN (Qu’est-ce que l’ADN?, s. d.). La succession particulière des nucléotides le long d’une molécule d’ADN est donc le support sur lequel est consignée l’information génétique.

L’ADN en tant que support documentaire?

La molécule d’ADN peut être considérée comme une sorte de « langage », l’information qu’elle contient devant être décodée par la cellule pour la synthèse des protéines dont elle a besoin, un peu à la manière d’un livre de recettes (Qu’est-ce que l’ADN?, s. d.). Vu sous cet angle, il n’est peut-être pas surprenant que certains chercheurs en soient venus à envisager la possibilité d’utiliser l’ADN pour y consigner de l’information autre que génétique.

Représentation schématisée d’un segment de molécule d’ADN. Image tirée de Wikipédia (« Acide désoxyribonucléique », repéré à https://fr.wikipedia.org/wiki/Acide_désoxyribonucléique)

Comme le souligne Cox (2001), l’ADN présente d’excellentes qualités pour le stockage de données :

  1. Son usage à cette fin a fait ses preuves (la vie existant sur Terre depuis au moins 3,5 milliards d’années) ;
  2. Les conditions s’y prêtant, il peut être conservé sur des périodes de l’ordre de millions d’années ;
  3. Il a la capacité de se reproduire lui-même ;
  4. Sa séquence de nucléotides peut contenir une quantité considérable d’information.

La « densité de mémorisation » de l’ADN est effectivement très élevée : en théorie, on pourrait y coder jusqu’à 2 bits par nucléotide, soit environ 455 exaoctets (ou 455 milliards de milliards d’octets, selon la définition d’exaoctet donnée dans Le grand dictionnaire terminologique [2000], ce qui équivaut, après conversion, à 455 millions de téraoctets, si l’on veut comparer avec le disque de verre nanostructuré mentionné précédemment) par gramme d’ADN à simple brin (Church, Gao et Kosuri, 2012).

Dans un billet ultérieur, sans aller trop loin dans les détails, nous présenterons, en ordre chronologique, quelques-unes des méthodes qui ont été élaborées dans le but de consigner de l’information au moyen d’ADN.  Les sources consultées seront également mentionnées dans ce billet.