Archives par étiquette : Bagger

Boîte à outils portables : créer un bordereau de versement pour Bagger

DOMINIC BOISVERT, chargé de cours

 

Dans un billet précédent nous avons démontré qu’il est possible d’utiliser des applications portables pour générer un SIP. L’un des logiciels que nous avons utilisé était Bagger [1]. Bagger est développé par la Library of Congress des États-Unis et est livré avec quelques profils de métadonnées. Dans ce billet, nous verrons comment modifier les profils de métadonnées et même comment en créer un nouveau.

Bagger peut être utilisé à toutes les étapes de traitement d’archives numériques. Puisqu’un fichier produit par Bagger (un sac dans la terminologie du projet) n’est rien d’autre qu’un fichier compressé auquel sont ajoutés des métadonnées. Le fichier compressé contient l’ensemble des documents que vous avez sélectionnés, en conservant la structure hiérarchique, en plus d’un inventaire des fichiers avec leur somme de contrôle. Vous pouvez paramétrer Bagger pour choisir, entre autres, le format de compression, l’algorithme de la somme de contrôle et déterminer certaines informations d’identification du sac. C’est précisément le sujet de ce billet.

Dans le billet précédent, nous utilisions Bagger pour regrouper des documents numériques pour en faire le versement. Il serait aussi possible d’utiliser Bagger pour stocker des AIP (Archival information Package, les paquets d’information à archiver) et même au moment de diffuser le contenu d’un AIP sous forme de paquet d’information à diffuser (DIP).

L’un des avantages de Bagger est qu’il ajoute des métadonnées au fichier compressé. Une partie de ces métadonnées forme l’équivalent d’un bordereau de versement. Voyons comment modifier un profil de métadonnées pour qu’il réponde aux besoins de votre institution.

Lorsque vous lancez Bagger pour la première fois, celui-ci crée un répertoire « bagger » dans lequel sont copiés différents profils de métadonnées. Les profils de métadonnées sont en format JSON. Le « JSON » JavaScript Object Notation – Notation Objet issue de JavaScript) est un format léger d’échange de données. » [2] Il a l’avantage d’être facile à lire par l’humain et d’être extrêmement malléable.

L’un des profils est « other-project-profile.json ». Nous l’utiliserons comme canevas de départ. Je vous suggère de le copier et de le renommer « mon-profil.json ». Vous pourriez aussi simplement créer un fichier vide avec un éditeur de texte comme bloc-note ou Notepad++ ou atom.io (mon préféré).

Le profil de métadonnées contient des couples nom/valeur comme celui-ci :

« Send-To-Name » : { « requiredValue » : « Sandy Bostian » },

Ici, le nom est « Send-to-Name » et la valeur est « Sandy Bostian ». L’expression « requiredValue » réfère à la boite de saisie dans le logiciel Bagger. Il est aussi possible de rendre un couple nom/valeur obligatoire en ajoutant la ligne « fieldRequired : true ».

En inscrivant une valeur (ici, Sandy Bostian) dans le profil nous pouvons pré-remplir le bordereau ou donner un exemple au producteur.

Il s’agit maintenant de déterminer quels sont les couples nom/valeur dont vous avez besoin dans votre bordereau de versement. Si votre organisme possède déjà un bordereau de versement, vous devriez y puiser vos couples nom/valeur. Pour notre exemple, nous nous limiterons à six couples : (1) Identification du producteur, (2) Courriel du producteur, (3) Identifiant du versement, (4) Identification de l’OAIS, (5) Identification du protocole de versement, et (6) Identifiant du versement.

Le couple « Identification du producteur » permet d’identifier la personne ou l’organisme producteur du SIP.

Comme il s’agit d’une information importante, nous la rendrons obligatoire. Et pour aider notre producteur nous ajouterons « Votre nom ou celui de votre institution » pour l’informer qu’il doit s’identifier.

« Identification du producteur » : {
« fieldRequired » : true, « requiredValue » : « Votre nom ou celui de votre institution »
},

Le couple « Courriel du producteur » permet de documenter au moins un moyen de communication avec le producteur. Comme cette information est aussi disponible ailleurs nous la laisserons facultative.

« Courriel du producteur » : {
« requiredValue » : «  »
},

Le couple « Identifiant du versement » permet de repérer le versement parmi d’autres fait par le même producteur.

« Identifiant du versement » : { « fieldRequired » : true, « requiredValue » : « Identifiant donnée par le producteur »},

Ici, vous identifiez votre institution.

« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},

Le couple « Identification du protocole de versement » permet de documenter le numéro ou un autre identifiant du protocole de versement signé entre le producteur et votre organisme.

« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »
},

Notre dernier couple identifie le versement dans le système de gestion des archives de votre organisme.

« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}

Le fichier complet :

{
« Identification du producteur » :
{
« fieldRequired » : true, « requiredValue » :
« ACME »
},
« Courriel du producteur » : {
« requiredValue » :  »
},
« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant donnée par le producteur »
},
« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},
« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »},
« Identifiant du versement » :
{ « fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}
}

Attention à respecter l’écriture JSON. S’il y a plus d’un élément dans un couple nom/valeur il faut mettre une virgule entre les éléments (à la fin des lignes dans notre exemple), sauf au dernier. Les indentations ne sont pas obligatoires et ne servent qu’à faciliter la lecture. Chaque couple nom/valeur pourrait être sur une seule ligne mais cela alourdi la lecture.

Voilà, vous avez maintenant un profil de métadonnées JSON compatible avec Bagger et les besoins de votre organisme. Au prochain démarrage de Bagger, votre profil sera disponible dans la liste des profils.

Notes

[1] https://github.com/LibraryOfCongress/bagger

[2] http://w w w.JSON.org/JSON-fr.html