Archives de catégorie : Législation et normes

Boîte à outils portables : créer un bordereau de versement pour Bagger

DOMINIC BOISVERT, chargé de cours

 

Dans un billet précédent nous avons démontré qu’il est possible d’utiliser des applications portables pour générer un SIP. L’un des logiciels que nous avons utilisé était Bagger [1]. Bagger est développé par la Library of Congress des États-Unis et est livré avec quelques profils de métadonnées. Dans ce billet, nous verrons comment modifier les profils de métadonnées et même comment en créer un nouveau.

Bagger peut être utilisé à toutes les étapes de traitement d’archives numériques. Puisqu’un fichier produit par Bagger (un sac dans la terminologie du projet) n’est rien d’autre qu’un fichier compressé auquel sont ajoutés des métadonnées. Le fichier compressé contient l’ensemble des documents que vous avez sélectionnés, en conservant la structure hiérarchique, en plus d’un inventaire des fichiers avec leur somme de contrôle. Vous pouvez paramétrer Bagger pour choisir, entre autres, le format de compression, l’algorithme de la somme de contrôle et déterminer certaines informations d’identification du sac. C’est précisément le sujet de ce billet.

Dans le billet précédent, nous utilisions Bagger pour regrouper des documents numériques pour en faire le versement. Il serait aussi possible d’utiliser Bagger pour stocker des AIP (Archival information Package, les paquets d’information à archiver) et même au moment de diffuser le contenu d’un AIP sous forme de paquet d’information à diffuser (DIP).

L’un des avantages de Bagger est qu’il ajoute des métadonnées au fichier compressé. Une partie de ces métadonnées forme l’équivalent d’un bordereau de versement. Voyons comment modifier un profil de métadonnées pour qu’il réponde aux besoins de votre institution.

Lorsque vous lancez Bagger pour la première fois, celui-ci crée un répertoire « bagger » dans lequel sont copiés différents profils de métadonnées. Les profils de métadonnées sont en format JSON. Le « JSON » JavaScript Object Notation – Notation Objet issue de JavaScript) est un format léger d’échange de données. » [2] Il a l’avantage d’être facile à lire par l’humain et d’être extrêmement malléable.

L’un des profils est « other-project-profile.json ». Nous l’utiliserons comme canevas de départ. Je vous suggère de le copier et de le renommer « mon-profil.json ». Vous pourriez aussi simplement créer un fichier vide avec un éditeur de texte comme bloc-note ou Notepad++ ou atom.io (mon préféré).

Le profil de métadonnées contient des couples nom/valeur comme celui-ci :

« Send-To-Name » : { « requiredValue » : « Sandy Bostian » },

Ici, le nom est « Send-to-Name » et la valeur est « Sandy Bostian ». L’expression « requiredValue » réfère à la boite de saisie dans le logiciel Bagger. Il est aussi possible de rendre un couple nom/valeur obligatoire en ajoutant la ligne « fieldRequired : true ».

En inscrivant une valeur (ici, Sandy Bostian) dans le profil nous pouvons pré-remplir le bordereau ou donner un exemple au producteur.

Il s’agit maintenant de déterminer quels sont les couples nom/valeur dont vous avez besoin dans votre bordereau de versement. Si votre organisme possède déjà un bordereau de versement, vous devriez y puiser vos couples nom/valeur. Pour notre exemple, nous nous limiterons à six couples : (1) Identification du producteur, (2) Courriel du producteur, (3) Identifiant du versement, (4) Identification de l’OAIS, (5) Identification du protocole de versement, et (6) Identifiant du versement.

Le couple « Identification du producteur » permet d’identifier la personne ou l’organisme producteur du SIP.

Comme il s’agit d’une information importante, nous la rendrons obligatoire. Et pour aider notre producteur nous ajouterons « Votre nom ou celui de votre institution » pour l’informer qu’il doit s’identifier.

« Identification du producteur » : {
« fieldRequired » : true, « requiredValue » : « Votre nom ou celui de votre institution »
},

Le couple « Courriel du producteur » permet de documenter au moins un moyen de communication avec le producteur. Comme cette information est aussi disponible ailleurs nous la laisserons facultative.

« Courriel du producteur » : {
« requiredValue » : «  »
},

Le couple « Identifiant du versement » permet de repérer le versement parmi d’autres fait par le même producteur.

« Identifiant du versement » : { « fieldRequired » : true, « requiredValue » : « Identifiant donnée par le producteur »},

Ici, vous identifiez votre institution.

« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},

Le couple « Identification du protocole de versement » permet de documenter le numéro ou un autre identifiant du protocole de versement signé entre le producteur et votre organisme.

« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »
},

Notre dernier couple identifie le versement dans le système de gestion des archives de votre organisme.

« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}

Le fichier complet :

{
« Identification du producteur » :
{
« fieldRequired » : true, « requiredValue » :
« ACME »
},
« Courriel du producteur » : {
« requiredValue » :  »
},
« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant donnée par le producteur »
},
« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},
« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »},
« Identifiant du versement » :
{ « fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}
}

Attention à respecter l’écriture JSON. S’il y a plus d’un élément dans un couple nom/valeur il faut mettre une virgule entre les éléments (à la fin des lignes dans notre exemple), sauf au dernier. Les indentations ne sont pas obligatoires et ne servent qu’à faciliter la lecture. Chaque couple nom/valeur pourrait être sur une seule ligne mais cela alourdi la lecture.

Voilà, vous avez maintenant un profil de métadonnées JSON compatible avec Bagger et les besoins de votre organisme. Au prochain démarrage de Bagger, votre profil sera disponible dans la liste des profils.

Notes

[1] https://github.com/LibraryOfCongress/bagger

[2] http://w w w.JSON.org/JSON-fr.html

Boîte à outils portables : logiciels nécessaires à la création d’un SIP

DOMINIC BOISVERT, chargé de cours

« Oui, mais on fait quoi lorsque notre organisme est trop petit ou n’a pas les moyens d’acheter ou même d’installer un logiciel libre pour gérer les dépôts ou les versements de documents numériques ? »

Cette question, les étudiants qui suivent le cours Gestion des archives numériques (ARV3054) me la posent régulièrement. En toute légitimité, ils veulent savoir s’il est possible créer un SIP ou un AIP (Administration Information Package) sans logiciel de type serveur comme Archivematica ? Eh bien, oui, c’est possible… mais, pour ce faire, ils devront utiliser des logiciels libres qui ne nécessitent pas d’installation et adopter une procédure qu’ils suivront avec assiduité.

Et c’est justement l’objet de ce billet : l’identification des logiciels nécessaires à la création d’un SIP (System Information Package). [1]

LES LOGICIELS POUR CRÉER UN SIP

D’abord, qu’est-ce qu’un SIP ? Le SIP est le paquet d’information à archiver du modèle OAIS (Open Archives Information System). Il s’agit ni plus ni moins qu’un projet de dépôt ou de versement de documents d’archives numériques.

Voici les logiciels que nous utiliserons pour réaliser notre SIP :

  • 7zip, pour décompresser les fichiers existants, si nécessaire ;
  • ClamAV, pour s’assurer de ne pas archiver de virus ;
  • DROID, pour identifier les fichiers qui nous voulons archiver [2] ;
  • Bagger, pour faire le sac du SIP [2].

Une fois les logiciels téléchargés, veuillez les copier sur une clé USB en ayant soin de renommer les répertoires des logiciels ainsi :

  • 01_7zip
  • 02_ClamAV
  • 03_DROID
  • 04_Bagger

Comme vous l’aurez sans doute deviné, les chiffres précédés de la barre de soulignement représentent l’ordre d’exécution des logiciels dans notre procédure de création d’un SIP.

Vous vous demandez peut-être pourquoi nous recommandons de copier les logiciels sur un clé USB ? En effet, vous pourriez très bien les installer sur votre poste de travail. Par contre, vous pourriez être appelé à vous déplacer chez les producteurs et devoir alors travailler sur les postes de ceux-ci. Il arrive aussi que l’archiviste ou le producteur n’ait pas les privilèges nécessaires pour installer des logiciels sur leurs ordinateurs. Voilà pourquoi les applications portables vous permettront de travailler sans laisser de traces sur l’ordinateur du producteur.

LA PROCÉDURE POUR CRÉER UN SIP

Les logiciels sont tous présents sur la clé USB et les répertoires sont identifiés avec le numéro de l’étape d’utilisation.

Étape 0 : Créez un répertoire de travail temporaire que vous nommerez « SIP_AAAA-MM-JJ ».

Étape 1 : Déplacez les dossiers et les documents à traiter dans le répertoire de travail temporaire. Si nécessaire, décompressez les dossiers à traiter pour créer votre SIP avec 7zip ou le logiciel de décompression intégré dans le système d’exploitation de l’ordinateur.

Étape 2 : Démarrez ClamAV en vous assurant de mettre à jour la base de données de l’anti-virus. Puis, analysez le répertoire de travail temporaire.

  • Si ClamAV vous indique que tout va bien, fermez ClamAV et passez à l’étape 3.
  • Si ClamAV découvre un fichier infecté par un virus, alors isolez ce fichier en le plaçant dans un répertoire de quarantaine en prenant soin de ne pas l’inclure dans les étapes suivantes. Passer à l’étape 3.

Étape 3 : Démarrez DROID en vous assurant de mettre à jour la base de données des formats de fichiers. Puis, analysez le répertoire de travail temporaire. Ensuite, sauvegardez le résultat de l’analyse dans le répertoire de travail temporaire sous le nom « SIP_AAAA-MM-JJ_DROID.csv ». Fermez DROID.

Étape 4 :  Démarrez Bagger et créez un sac en format zip. Ajoutez les métadonnées nécessaires au traitement du SIP, puis enregistrez le sac en le nommant : « SIP_AAAA-MM-JJ.zip »

Étape 5. Après vous être assuré que le fichier SIP_AAAA-MM-JJ.zip est complet (vous pouvez l’analyser avec Bagger), vous devez supprimer le répertoire de travail temporaire.

Ajoutez un élément distinctif à la fin du nom de vos SIP si vous devez créer plus d’un SIP dans la même journée. Cet élément peut identifier le producteur ou être simplement un numéro séquentiel (l’identification du producteur est déjà l’une des métadonnées de votre sac Bagger).

Vous pourriez sauter l’étape 3 avec DROID et ne faire l’analyse des formats de fichiers que lors du traitement du SIP pour en faire un AIP. Personnellement, je préfère réaliser l’analyse immédiatement pour exclure certains types de fichiers (les fichiers temporaires, par exemple).

CONCLUSION

La gestion des archives numériques sans suite logicielle s’avère possible. Il suffit d’établir nos objectifs et de dénicher les logiciels qui nous permettront de les atteindre une étape à la fois.

Dans un prochain billet, nous verrons comment paramétrer Bagger pour que les métadonnées du sac reflètent les informations de votre bordereau de dépôt ou de versement.

Notes

[1] Ce billet de blogue s’inspire librement d’un article intitulé Practical Digital Preservation: In-House Solutions to Digital Preservation for Small Institutions de Tyller McNally.

[1] Les logiciels DROID et Bagger nécessitent l’installation de  JAVA. Vous pouvez utiliser la version Jportable si JAVA n’est pas installé sur l’ordinateur à partir duquel vous exécuterez la procédure.

Les agendas des ministres : la démocratie contre l’histoire

DANIEL DUCHARME, chargé de cours

Les partisans du big data me font sourire, parfois. Car ils s’imaginent œuvrer pour une plus grande démocratie dans la gestion des affaires de l’État. Au Québec, par exemple, vous trouverez un site Web consacré à la transparence des membres du Conseil des ministres. Depuis le 1er janvier 2015, un citoyen peut consulter à loisir l’emploi du temps de son ministre préféré. En novembre 2014, dans un article publié sur le site du journal Le Devoir, le ministre Jean-Marc Fournier, ministre responsable des Affaires intergouvernementales canadiennes et de la Francophonie canadienne, estimait qu’il s’agissait d’une illustration concrète du souci de transparence des élus.

Que faut-il penser, d’un point de vue archivistique [*], de cette « avancée » de la démocratie parlementaire ? Lors du 7e Symposium du Groupe interdisciplinaire de recherche sur les archives (GIRA), dans une conférence prononcée par Alain Savoie, président de la société Irosoft, celui-ci se demandait s’il fallait tout publier, tout diffuser. En traitant de la question des données [*] ouvertes (Open Data), il a justement pris en exemple les agendas… Il a alors souligné – avec justesse, je crois – que le fait de mettre en ligne des agendas allait amoindrir leur valeur probante [*]. En effet, que pensez-vous qu’un ministre va inscrire dans son agenda s’il est disponible en ligne? Il ne mettra sur le Web que ses rendez-vous officiels et en taira plusieurs autres, ce qui me semble assez normal compte tenu de son degré d’exposition. Surtout, il ne mettra aucun nom, aucune adresse, aucun renseignement susceptible de contrevenir à la législation sur la protection des données à caractère personnel. Et que va-t-il résulter de tout ça ? Un agenda réduit à sa plus simple expression. Un document pauvre en information.  Bref, sous prétexte de contribuer à la démocratie, on vide les agendas de leur substance, de leur contenu informationnel et, surtout, on atténue grandement leur qualité de source pour l’histoire.

Les documents d’archives constituent des matériaux pour les chercheurs, historiens ou pas. Ils permettent de témoigner des faits et gestes des personnes et des organisations à travers le temps. Certes, les mettre à la disposition immédiate du public peut constituer un bienfait pour la démocratie, mais, comme toute médaille à son revers, cela atténue grandement leur valeur d’information et de témoignage [*]. Résultat: demain, nos enfants et leurs enfants ne sauraient plus rien.

[*] Les définitions suivantes sont tirées de la Terminologie de base en archivistique de l’EBSI (2015):

  • Archivistique: La discipline qui recouvre les principes et les méthodes régissant la création, le traitement, la conservation et l’utilisation des archives. (Couture, Ducharme et Rousseau, 1988, p. 56).
  • Donnée:  La donnée peut être définie comme la plus petite représentation conventionnelle  et fondamentale d’une information (fait, notion, objet, nom propre, chiffre, statistique, etc.) sous une forme analogique ou digitale permettant d’en effectuer le traitement manuel ou automatique (informatique).  (Rousseau et Couture, 1994, p.123)
  • Valeur de témoignage: Permet de saisir la capacité des documents de renseigner sur son producteur. Dans le cas d’un organisme, les archives doivent témoigner de son organisation, de ses activités, de son fonctionnement, de ses réalisations et de son évolution. Dans le cas d’un individu, les documents témoignent de sa vie personnelle et professionnelle, de ses réalisations et de son évolution. » (Charbonneau et Robert, 2001, p. 255)
  • Valeur probante: Qualité des documents d’archives qui leur permette de servir de preuve.  (DAF, 2007, p. 35)