Archives de catégorie : Gestion des documents d’activité

Enquête sur les archives des archives

WILLIAM YOAKIM, étudiant au doctorat
YVON LEMAY, professeur agrégé
CHRISTINE DUFOUR, professeure agrégée

Créer, évaluer, préserver, éliminer et exploiter des documents, telle est une partie des tâches effectuées quotidiennement par les archivistes du monde entier. Bien réalisées, ces actions contribuent à préserver la mémoire de familles, d’entreprises, de villes, de régions, de pays, et, d’une certaine manière, de l’humanité. Les archivistes doivent, afin de développer une rigueur de travail exemplaire, se doter de règles, mais également d’outils qui viendront les épauler dans l’accomplissement de leur mission. Dépositaires d’une science évoluant, s’adaptant et, parfois, subissant l’histoire des hommes, les responsables de services et de centres d’archives ne cessent de prodiguer aides et conseils aux créateurs de documents. Parmi ces recommandations, l’utilisation d’un plan de classification et d’un calendrier de conservation, permettant respectivement une meilleure identification et conservation de la production documentaire, est continuellement prônée. Quand ils sont bien réalisés, ces deux outils de gestion sont considérés comme constituant la base d’un traitement optimal et réfléchi des documents produits. Il n’est donc guère surprenant de voir Bibliothèque et Archives nationales du Québec (BAnQ) en faire la promotion auprès des organismes publics : « Avec le plan de classification, le calendrier de conservation constitue un des éléments de base de la saine gestion documentaire d’un organisme public. » (BAnQ, s. d.)

Face à ces recommandations du milieu archivistique, il est légitime et pertinent de se questionner sur la gestion des documents directement produits et/ou reçus par les services et centres d’archives. Les responsables de ces derniers utilisent-ils les mêmes outils qu’ils recommandent ? Comme le démontrent certains ouvrages consacrés à la gestion des centres d’archives, tels que Keeping Archives de l’Australian Society of Archivists (Ellis, 1993), ces derniers doivent continuellement gérer et produire de nombreux documents afin d’assurer une saine gestion de ceux dont ils ont la charge. Malheureusement, comme l’affirme Jacques Grimard dans La gestion d’un centre d’archives : Mélange en l’honneur de Robert Garon :

La gestion de l’information, des documents, des archives mêmes nécessaires au fonctionnement des institutions ou services d’archives ou de gestion des documents n’a pas fait l’objet de recherche ni de réflexion très poussée. (Gagnon-Arguin et Grimard, 2003, p. 123)

Ainsi, à la certitude quant à la quantité importante de documents produits et/ou reçus par les services et les centres d’archives, s’oppose une absence remarquée de la littérature secondaire sur ce sujet. Immanquablement vient alors la question de savoir si les services et centres d’archives assurent la préservation de leur patrimoine documentaire de manière aussi efficace que celle qu’ils prônent et mettent en place pour les autres producteurs de documents. Les archivistes du futur pourront-ils trouver suffisamment de ressources lorsqu’il s’agira de s’interroger sur la gestion des services et centres d’archives de la fin du XXe et début du XXIe siècle ?

C’est afin de répondre aux nombreuses interrogations relevées ci-dessus qu’une enquête exploratoire, ayant pour objectif de saisir et de décrire un domaine encore peu exploré dans la littérature (Fortin et Gagnon, 2016, p. 69), a été menée en 2016. Le but principal a été d’identifier le traitement des documents produits et/ou reçus par les services et les centres d’archives du Québec dans le cadre de leurs activités. Ces derniers utilisent-ils un plan de classification et/ou un calendrier de conservation regroupant de manière exhaustive leurs documents de gestion et de fonction ou d’exploitation ?

Grâce à un questionnaire auto-administré et en ligne, plus de quatre-vingt-dix (46) centres d’archives dans la liste des membres du Réseau des services d’archives du Québec (RAQ) ont été contactés et plus de 40% de ces derniers nous ont fourni des réponses complètes et exploitables. Elles révèlent que même si l’existence d’un plan de classification et d’un calendrier de conservation semble, d’un premier regard, être acquise pour la majorité des services et centres d’archives interrogées, ces outils ne sont pas sans lacune et indiquent un problème général de préservation des documents produits et/ou reçus par les services et centres d’archives du Québec.

La méthodologie de travail mise en place, mais également les nombreux résultats obtenus dans le cadre de cette enquête sont disponibles dans Papyrus, le dépôt institutionnel de l’Université de Montréal.

 

Sources consultées:

  • BAnQ. (s. d.). Calendrier de conservation.
  • Ellis, J. (dir.). (1993). Keeping archives. Victoria, Australie : D.W. Thorpe ; Australian Society of Archivists Inc.
  • Fortin, M.-F. et Gagnon, J. (dir.). (2016). Fondements et étapes du processus de recherche. Montréal, QC : Chenelière éducation.
  • Gagnon-Arguin, L. et Grimard, J. (dir.). (2003). La gestion d’un centre d’archives : mélanges en l’honneur de Robert Garon. Québec, QC : Presses de l’Université du Québec.

Boîte à outils portables : créer un bordereau de versement pour Bagger

DOMINIC BOISVERT, chargé de cours

 

Dans un billet précédent nous avons démontré qu’il est possible d’utiliser des applications portables pour générer un SIP. L’un des logiciels que nous avons utilisé était Bagger [1]. Bagger est développé par la Library of Congress des États-Unis et est livré avec quelques profils de métadonnées. Dans ce billet, nous verrons comment modifier les profils de métadonnées et même comment en créer un nouveau.

Bagger peut être utilisé à toutes les étapes de traitement d’archives numériques. Puisqu’un fichier produit par Bagger (un sac dans la terminologie du projet) n’est rien d’autre qu’un fichier compressé auquel sont ajoutés des métadonnées. Le fichier compressé contient l’ensemble des documents que vous avez sélectionnés, en conservant la structure hiérarchique, en plus d’un inventaire des fichiers avec leur somme de contrôle. Vous pouvez paramétrer Bagger pour choisir, entre autres, le format de compression, l’algorithme de la somme de contrôle et déterminer certaines informations d’identification du sac. C’est précisément le sujet de ce billet.

Dans le billet précédent, nous utilisions Bagger pour regrouper des documents numériques pour en faire le versement. Il serait aussi possible d’utiliser Bagger pour stocker des AIP (Archival information Package, les paquets d’information à archiver) et même au moment de diffuser le contenu d’un AIP sous forme de paquet d’information à diffuser (DIP).

L’un des avantages de Bagger est qu’il ajoute des métadonnées au fichier compressé. Une partie de ces métadonnées forme l’équivalent d’un bordereau de versement. Voyons comment modifier un profil de métadonnées pour qu’il réponde aux besoins de votre institution.

Lorsque vous lancez Bagger pour la première fois, celui-ci crée un répertoire « bagger » dans lequel sont copiés différents profils de métadonnées. Les profils de métadonnées sont en format JSON. Le « JSON » JavaScript Object Notation – Notation Objet issue de JavaScript) est un format léger d’échange de données. » [2] Il a l’avantage d’être facile à lire par l’humain et d’être extrêmement malléable.

L’un des profils est « other-project-profile.json ». Nous l’utiliserons comme canevas de départ. Je vous suggère de le copier et de le renommer « mon-profil.json ». Vous pourriez aussi simplement créer un fichier vide avec un éditeur de texte comme bloc-note ou Notepad++ ou atom.io (mon préféré).

Le profil de métadonnées contient des couples nom/valeur comme celui-ci :

« Send-To-Name » : { « requiredValue » : « Sandy Bostian » },

Ici, le nom est « Send-to-Name » et la valeur est « Sandy Bostian ». L’expression « requiredValue » réfère à la boite de saisie dans le logiciel Bagger. Il est aussi possible de rendre un couple nom/valeur obligatoire en ajoutant la ligne « fieldRequired : true ».

En inscrivant une valeur (ici, Sandy Bostian) dans le profil nous pouvons pré-remplir le bordereau ou donner un exemple au producteur.

Il s’agit maintenant de déterminer quels sont les couples nom/valeur dont vous avez besoin dans votre bordereau de versement. Si votre organisme possède déjà un bordereau de versement, vous devriez y puiser vos couples nom/valeur. Pour notre exemple, nous nous limiterons à six couples : (1) Identification du producteur, (2) Courriel du producteur, (3) Identifiant du versement, (4) Identification de l’OAIS, (5) Identification du protocole de versement, et (6) Identifiant du versement.

Le couple « Identification du producteur » permet d’identifier la personne ou l’organisme producteur du SIP.

Comme il s’agit d’une information importante, nous la rendrons obligatoire. Et pour aider notre producteur nous ajouterons « Votre nom ou celui de votre institution » pour l’informer qu’il doit s’identifier.

« Identification du producteur » : {
« fieldRequired » : true, « requiredValue » : « Votre nom ou celui de votre institution »
},

Le couple « Courriel du producteur » permet de documenter au moins un moyen de communication avec le producteur. Comme cette information est aussi disponible ailleurs nous la laisserons facultative.

« Courriel du producteur » : {
« requiredValue » : «  »
},

Le couple « Identifiant du versement » permet de repérer le versement parmi d’autres fait par le même producteur.

« Identifiant du versement » : { « fieldRequired » : true, « requiredValue » : « Identifiant donnée par le producteur »},

Ici, vous identifiez votre institution.

« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},

Le couple « Identification du protocole de versement » permet de documenter le numéro ou un autre identifiant du protocole de versement signé entre le producteur et votre organisme.

« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »
},

Notre dernier couple identifie le versement dans le système de gestion des archives de votre organisme.

« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}

Le fichier complet :

{
« Identification du producteur » :
{
« fieldRequired » : true, « requiredValue » :
« ACME »
},
« Courriel du producteur » : {
« requiredValue » :  »
},
« Identifiant du versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant donnée par le producteur »
},
« Identification de l’OAIS » : {
« fieldRequired » : true,
« requiredValue » : « Inscrire le nom de votre institution »
},
« Identification du protocole de versement » : {
« fieldRequired » : true,
« requiredValue » : « Identifiant unique du protocole de versement »},
« Identifiant du versement » :
{ « fieldRequired » : true,
« requiredValue » : « ID unique du SIP »
}
}

Attention à respecter l’écriture JSON. S’il y a plus d’un élément dans un couple nom/valeur il faut mettre une virgule entre les éléments (à la fin des lignes dans notre exemple), sauf au dernier. Les indentations ne sont pas obligatoires et ne servent qu’à faciliter la lecture. Chaque couple nom/valeur pourrait être sur une seule ligne mais cela alourdi la lecture.

Voilà, vous avez maintenant un profil de métadonnées JSON compatible avec Bagger et les besoins de votre organisme. Au prochain démarrage de Bagger, votre profil sera disponible dans la liste des profils.

Notes

[1] https://github.com/LibraryOfCongress/bagger

[2] http://w w w.JSON.org/JSON-fr.html

Boîte à outils portables : logiciels nécessaires à la création d’un SIP

DOMINIC BOISVERT, chargé de cours

« Oui, mais on fait quoi lorsque notre organisme est trop petit ou n’a pas les moyens d’acheter ou même d’installer un logiciel libre pour gérer les dépôts ou les versements de documents numériques ? »

Cette question, les étudiants qui suivent le cours Gestion des archives numériques (ARV3054) me la posent régulièrement. En toute légitimité, ils veulent savoir s’il est possible créer un SIP ou un AIP (Administration Information Package) sans logiciel de type serveur comme Archivematica ? Eh bien, oui, c’est possible… mais, pour ce faire, ils devront utiliser des logiciels libres qui ne nécessitent pas d’installation et adopter une procédure qu’ils suivront avec assiduité.

Et c’est justement l’objet de ce billet : l’identification des logiciels nécessaires à la création d’un SIP (System Information Package). [1]

LES LOGICIELS POUR CRÉER UN SIP

D’abord, qu’est-ce qu’un SIP ? Le SIP est le paquet d’information à archiver du modèle OAIS (Open Archives Information System). Il s’agit ni plus ni moins qu’un projet de dépôt ou de versement de documents d’archives numériques.

Voici les logiciels que nous utiliserons pour réaliser notre SIP :

  • 7zip, pour décompresser les fichiers existants, si nécessaire ;
  • ClamAV, pour s’assurer de ne pas archiver de virus ;
  • DROID, pour identifier les fichiers qui nous voulons archiver [2] ;
  • Bagger, pour faire le sac du SIP [2].

Une fois les logiciels téléchargés, veuillez les copier sur une clé USB en ayant soin de renommer les répertoires des logiciels ainsi :

  • 01_7zip
  • 02_ClamAV
  • 03_DROID
  • 04_Bagger

Comme vous l’aurez sans doute deviné, les chiffres précédés de la barre de soulignement représentent l’ordre d’exécution des logiciels dans notre procédure de création d’un SIP.

Vous vous demandez peut-être pourquoi nous recommandons de copier les logiciels sur un clé USB ? En effet, vous pourriez très bien les installer sur votre poste de travail. Par contre, vous pourriez être appelé à vous déplacer chez les producteurs et devoir alors travailler sur les postes de ceux-ci. Il arrive aussi que l’archiviste ou le producteur n’ait pas les privilèges nécessaires pour installer des logiciels sur leurs ordinateurs. Voilà pourquoi les applications portables vous permettront de travailler sans laisser de traces sur l’ordinateur du producteur.

LA PROCÉDURE POUR CRÉER UN SIP

Les logiciels sont tous présents sur la clé USB et les répertoires sont identifiés avec le numéro de l’étape d’utilisation.

Étape 0 : Créez un répertoire de travail temporaire que vous nommerez « SIP_AAAA-MM-JJ ».

Étape 1 : Déplacez les dossiers et les documents à traiter dans le répertoire de travail temporaire. Si nécessaire, décompressez les dossiers à traiter pour créer votre SIP avec 7zip ou le logiciel de décompression intégré dans le système d’exploitation de l’ordinateur.

Étape 2 : Démarrez ClamAV en vous assurant de mettre à jour la base de données de l’anti-virus. Puis, analysez le répertoire de travail temporaire.

  • Si ClamAV vous indique que tout va bien, fermez ClamAV et passez à l’étape 3.
  • Si ClamAV découvre un fichier infecté par un virus, alors isolez ce fichier en le plaçant dans un répertoire de quarantaine en prenant soin de ne pas l’inclure dans les étapes suivantes. Passer à l’étape 3.

Étape 3 : Démarrez DROID en vous assurant de mettre à jour la base de données des formats de fichiers. Puis, analysez le répertoire de travail temporaire. Ensuite, sauvegardez le résultat de l’analyse dans le répertoire de travail temporaire sous le nom « SIP_AAAA-MM-JJ_DROID.csv ». Fermez DROID.

Étape 4 :  Démarrez Bagger et créez un sac en format zip. Ajoutez les métadonnées nécessaires au traitement du SIP, puis enregistrez le sac en le nommant : « SIP_AAAA-MM-JJ.zip »

Étape 5. Après vous être assuré que le fichier SIP_AAAA-MM-JJ.zip est complet (vous pouvez l’analyser avec Bagger), vous devez supprimer le répertoire de travail temporaire.

Ajoutez un élément distinctif à la fin du nom de vos SIP si vous devez créer plus d’un SIP dans la même journée. Cet élément peut identifier le producteur ou être simplement un numéro séquentiel (l’identification du producteur est déjà l’une des métadonnées de votre sac Bagger).

Vous pourriez sauter l’étape 3 avec DROID et ne faire l’analyse des formats de fichiers que lors du traitement du SIP pour en faire un AIP. Personnellement, je préfère réaliser l’analyse immédiatement pour exclure certains types de fichiers (les fichiers temporaires, par exemple).

CONCLUSION

La gestion des archives numériques sans suite logicielle s’avère possible. Il suffit d’établir nos objectifs et de dénicher les logiciels qui nous permettront de les atteindre une étape à la fois.

Dans un prochain billet, nous verrons comment paramétrer Bagger pour que les métadonnées du sac reflètent les informations de votre bordereau de dépôt ou de versement.

Notes

[1] Ce billet de blogue s’inspire librement d’un article intitulé Practical Digital Preservation: In-House Solutions to Digital Preservation for Small Institutions de Tyller McNally.

[1] Les logiciels DROID et Bagger nécessitent l’installation de  JAVA. Vous pouvez utiliser la version Jportable si JAVA n’est pas installé sur l’ordinateur à partir duquel vous exécuterez la procédure.