Métadonnées : qu'est-ce que c'est et pourquoi elles sont essentielles à la conservation des documents

Publié: 2022-01-27

Les questions de gestion et de conservation des documents sont à l'ordre du jour de toutes les entreprises, grandes ou petites. Le fait que ces documents soient de plus en plus numériques (natifs ou à terme numérisés) a conduit les entreprises à se confronter à de nouveaux outils et concepts pas toujours faciles à appréhender. Surtout, il n'est pas toujours facile de comprendre l'importance et la centralité de certains éléments, ce qui rend plus difficile de comprendre comment les utiliser de manière efficace et productive, ou pourquoi il est important d'y prêter attention.

Le sujet dont nous allons parler aujourd'hui tombe directement dans cette description : metadata . Nous produisons et utilisons quotidiennement des métadonnées, parfois même sans le savoir, et elles sont fondamentales pour soutenir les activités que nous menons dans le cadre de notre travail qui implique la production, l'utilisation et la consultation de documents de toutes sortes.

Même si le mot « métadonnées » peut évoquer quelque chose de vague et d'abstrait, c'est quelque chose d'extrêmement concret : sans lui, nous ne pourrions pas produire ou rechercher une facture, ni récupérer ce contrat que nous avons signé il y a quelques années et que nous devons maintenant consulter. . Sans métadonnées, nous ne pourrions même pas récupérer les enregistrements que l'administration fiscale peut nous demander de montrer.

Essayons donc d'obtenir des éclaircissements pour en savoir plus sur ces problèmes.

Nouvelle incitation à l'action

Qu'est-ce que les métadonnées ?

Pour expliquer ce que sont les métadonnées, nous nous référerons à l'une des définitions les plus utilisées et probablement les plus efficaces : les métadonnées sont des données qui décrivent d'autres données.

Cela signifie que les métadonnées fournissent des données et des informations. Si l'on parle de documents électroniques, les métadonnées renseignent sur ces documents, permettent de les décrire et de les contextualiser, de préciser leur fonction et, le cas échéant, leur relation avec d'autres documents.

Souvent, les métadonnées peuvent être dérivées du contenu du document lui-même, d'autres fois elles sont dérivées de la production et de l'utilisation de ce document et peuvent être associées au document ultérieurement. D'autres fois, il est utilisé pour fournir des indications sur la manière dont un document doit être traité ou traité. Les métadonnées ont plusieurs fonctions et sont donc généralement divisées en catégories telles que :

  • métadonnées descriptives ;
  • métadonnées structurelles
  • métadonnées d'administration et de gestion

Certaines métadonnées sont faciles à identifier et se trouvent déjà dans le document ; d'autres peuvent être trouvées dans n'importe quel document informatique, tandis que d'autres types de métadonnées sont spécifiques à certains types de documents.

Les informations que nous trouvons dans chaque document incluent, par exemple, la date apposée sur le document, ou des informations sur son auteur, qu'il s'agisse d'une personne physique, d'une entreprise ou d'une institution. Le sujet du document, c'est-à-dire une brève description de son contenu, est une métadonnée transversale qui est utilisée dans la description de chaque type de document.

D'autre part, si nous parlons de factures ou d'autres documents fiscaux, un type fondamental de métadonnées est le numéro de TVA.

Inversement, pour un document de santé, tel qu'un rapport médical, il pourrait être utile d'inclure une référence indiquant l'établissement où un test de diagnostic a été effectué, afin de retrouver plus facilement le document selon ce critère de recherche, parmi les métadonnées.

En bref, toute information contenue dans ou associée au document peut devenir une métadonnée , pour autant qu'elle puisse jouer un rôle dans le cycle de vie de ce document : dans sa création, dans sa gestion et sa conservation, et dans sa récupération et ses utiliser.

Nouvelle incitation à l'action

Pourquoi les métadonnées sont essentielles

Maintenant que nous avons donné quelques exemples et identifié l'objet qui nous intéresse, essayons de comprendre pourquoi les métadonnées sont essentielles.

Au-delà des dispositions légales, sur lesquelles nous reviendrons dans un instant, la première fonction des métadonnées est de nous permettre de rechercher et de récupérer un document dans nos archives informatiques lorsque nous en avons besoin.

En fait, lorsque nous devons récupérer un document dans nos archives, nous devons utiliser des clés de recherche , si nous ne voulons pas passer nos journées à faire défiler des listes interminables d'enregistrements. Ces clés de recherche sont représentées par les métadonnées associées au document lors de sa saisie dans le système de gestion ou dans le système de conservation. Ces métadonnées, telles que la date, le sujet, le numéro de document, le numéro de TVA, etc., sont les outils que nous utilisons pour récupérer les bons documents au bon moment.

Métadonnées pour la gestion et la conservation des documents

En pratique, l'ensemble des métadonnées qui accompagnent un document, d'abord dans le système de gestion documentaire puis dans le système de conservation, est structuré selon des critères et normes précis et associé au document lui-même. C'est comme les informations au dos d'un dossier de documents qui nous permettent de comprendre si nous trouverons ou non les documents que nous recherchons dans ce dossier.

Même si un ensemble de métadonnées peut potentiellement être composé d'informations très variées, lorsqu'il s'agit d'en assurer une gestion et une conservation efficaces et conformes à la réglementation en vigueur , il est nécessaire de respecter des critères et des normes précises.

Comme nous l'avons mentionné, les métadonnées peuvent être subdivisées selon leur fonction.

Métadonnées descriptives

Les métadonnées descriptives , comme elles sont faciles à deviner, visent à décrire le document ou l'objet numérique auquel elles sont associées, afin d'en faciliter la recherche et la récupération . Les informations qui spécifient le sujet d'un document sont des métadonnées descriptives.

Métadonnées administratives et de gestion

Ces métadonnées, quant à elles, renseignent sur les traitements auxquels le document a fait ou doit faire l'objet, afin d'en assurer la pérennité , l'intégrité et l' authenticité dans le temps. Les métadonnées d'administration et de gestion peuvent être des métadonnées qui fournissent des informations sur les droits d'accès au document, ou des métadonnées qui indiquent la durée de conservation du document.

Métadonnées structurelles

Enfin, les métadonnées structurelles fournissent des informations permettant de localiser le document dans le système de conservation, de définir la structure interne du document ou d' identifier les relations avec d'autres documents. Par exemple, les métadonnées structurelles permettent de lier un document au fichier informatique auquel il appartient, afin d'établir une relation stable entre les deux objets.

Le rôle des réglementations sectorielles

Certaines métadonnées doivent donc toujours être présentes, car leur présence est indispensable pour récupérer les documents ; d'autres doivent être présents parce qu'ils servent de garant de l'intégrité du document, et d'autres parce qu'ils contextualisent le document et aident à le placer correctement par rapport aux autres documents.

Par ailleurs, d'autres métadonnées sont imposées par la réglementation, précisément en raison de leur rôle très important.

Les directives AgID sur la création, la gestion et la conservation des documents électroniques identifient un ensemble précis de métadonnées minimales obligatoires qui doivent être associées aux documents électroniques, aux documents administratifs électroniques et aux agrégations de documents électroniques (comme les fichiers électroniques, par exemple). Les métadonnées minimales obligatoires doivent être présentes à tout moment afin d'assurer un stockage conforme à la loi.

Dans certains cas, il existe des réglementations spécifiques à l'industrie en plus des directives de l'Agence pour l'Italie numérique.

C'est le cas des documents ayant une importance fiscale et fiscale, tels que les factures, les documents de transport, les commandes et les registres comptables. Dans ce cas, certaines normes, telles que le DPR 600/72 et l'Arrêté Ministériel du 17 juin 2014, donnent des indications précises sur les modalités de conservation de ces catégories de documents ainsi que sur les métadonnées. L'AM du 17 juin 2014, dans son article 3, établit que, parmi les métadonnées associées à ces documents particuliers, le nom et le prénom, la dénomination du code fiscal, le numéro de TVA, la date, doivent être inclus dans le document lui-même. En effet, ces informations et les associations entre elles sont jugées indispensables pour assurer la récupération des documents afin qu'ils puissent être reproduits aux autorités.

Il s'agit d'un exemple simple pour montrer comment les réglementations de l'industrie interviennent souvent, fournissant des indications précises qu'il faut garder à l'esprit lorsqu'on parle de préservation numérique .

L'impact des nouvelles directives AgID

L'entrée en vigueur récente des nouvelles lignes directrices AgID sur les documents informatiques a mis en lumière la question des métadonnées .

Les nouvelles lignes directrices ont modifié le système des métadonnées minimales obligatoires à associer au document informatique, qui était jusqu'à présent limité à 6 métadonnées obligatoires. La nouvelle norme double en fait le nombre de métadonnées minimales, exigeant que les nouvelles informations soient améliorées ; ce n'est pas toujours facile à identifier pour toutes les organisations.

Ce changement massif a contraint les entreprises et les fournisseurs spécialisés en préservation à effectuer des mises à niveau majeures de leurs systèmes afin de pouvoir gérer la nouvelle structure.

Au-delà des métadonnées minimales obligatoires

Bien sûr, en plus des métadonnées minimales requises par les différentes réglementations, il est toujours possible d'inclure des informations supplémentaires dans notre jeu de métadonnées, qui peuvent être utiles dans un contexte commercial spécifique et pour soutenir des fonctions de recherche, de gestion ou structurelles supplémentaires.

En parallèle, lorsque l'on veut enrichir un jeu de métadonnées avec des éléments supplémentaires, il est bon de suivre au moins quelques critères de base afin d'éviter la prolifération de champs au-delà de ce qui est nécessaire et toute complication inutile.

Tout d'abord, il est bon d'identifier les fonctions que nous devons assurer ou, par exemple, les clés de recherche que nous utilisons le plus souvent pour récupérer un type de document spécifique, et donc, quelles sont les métadonnées dont nous avons besoin. Certaines de ces informations font probablement déjà partie de l'ensemble minimal de métadonnées, telles que la date ou le sujet ; d'autres informations, peut-être spécifiquement liées à un certain contexte ou à des pratiques commerciales établies, peuvent manquer et il peut être utile de les inclure.

Cependant, la règle du « moins c'est plus » s'applique souvent : il ne sert à rien d'ajouter beaucoup d'informations que nous n'utiliserons jamais ou presque jamais pour rechercher ce document particulier ; il est préférable de se concentrer sur quelques éléments d'information significatifs. Une structure trop riche et complexe, à la longue, peut devenir difficile à gérer et peut s'avérer contre-productive, compliquant inutilement le travail des opérateurs et augmentant le risque d'erreurs.

Enfin, il est bon d'attribuer des "étiquettes" aux métadonnées que nous avons l'intention d'ajouter, c'est-à-dire des désignations qui rendent le sujet immédiatement clair et qui identifient les informations que nous devrions attendre de ces métadonnées. Ceci est essentiel pour plusieurs raisons.

Premièrement, il facilite le travail des opérateurs et réduit les risques d' erreurs de configuration ou de compilation .

Deuxièmement, alors que nous entrons dans le monde de la préservation numérique , la clarté est cruciale. Si nous devons déplacer nos archives d'un fournisseur de services de conservation à un autre, peut-être après quelques années, l'utilisation de métadonnées peu claires pourrait causer un certain nombre de problèmes et saper le degré d' interopérabilité et de compréhensibilité des index dans les packages de conservation, ce qui rend plus difficile pour effectuer des tâches.