元数据:它是什么以及为什么它对文档保留很重要

已发表: 2022-01-27

文件管理和保留的问题是每个企业的议程,无论大小。 这些文档越来越数字化(本地化或最终数字化)的事实导致公司面对并不总是容易理解的新工具和概念。 最重要的是,要理解某些元素的重要性和中心地位并不总是那么容易,这使得理解如何有效和高效地使用它们或者为什么关注它们很重要变得更加困难。

我们今天要讨论的主题正好属于这个描述:元数据 我们每天都在生产和使用元数据,有时甚至在不知情的情况下,它是支持我们在工作中开展的活动的基础,这些活动涉及各种文件的生产、使用和咨询。

虽然“元数据”这个词可能会让人想起一些模糊和抽象的东西,但它是非常具体的东西:没有它,我们无法制作或研究发票,也无法找回几年前签订的合同,现在需要咨询. 如果没有元数据,我们甚至无法检索税务机关可能要求我们展示的记录。

因此,让我们试着弄清楚以了解更多关于这些问题的信息。

新的号召性用语

什么是元数据?

为了解释什么是元数据,我们将参考最常用且可能最有效的定义之一:数据是描述其他数据的数据。

这意味着元数据提供数据和信息。 如果我们谈论电子文档,元数据会提供有关这些文档的信息,帮助描述和上下文化它们,阐明它们的功能,并在必要时阐明它们与其他文档的关系。

通常,元数据可以源自文档本身的内容,有时它源自该文档的生产和使用,并且可以在以后与该文档相关联。 其他时候,它用于提供有关如何处理或处理文档的指示。 元数据具有多种功能,因此通常分为以下几类:

  • 描述性元数据;
  • 结构元数据
  • 行政和管理元数据

一些元数据很容易识别并且已经在文档中找到; other 可以在任何计算机文档中找到,而其他类型的元数据特定于某些类型的文档。

我们在每份文件中找到的信息包括,例如,文件所附日期,或有关创建者的信息,无论是自然人、公司还是机构。 文档的主题,即对其内容的简要描述,是一种横向元数据,用于描述每种类型的文档。

另一方面,如果我们谈论发票或其他财政文件,元数据的基本类型是增值税号。

反之亦然,对于诸如医疗报告之类的医疗保健文档,在元数据中包含指示执行诊断测试的设施的参考可能很有用,以便根据此搜索标准更容易地检索文档。

简而言之,文档中包含或与之相关的任何信息都可以成为元数据,只要它能够在文档的生命周期中发挥作用:在其创建、管理和保存、检索和后续采用。

新的号召性用语

为什么元数据很重要

现在我们已经给出了一些示例并确定了我们感兴趣的对象,让我们尝试理解为什么元数据是必不可少的。

暂且不谈法律规定,元数据的第一个功能是允许我们在需要时计算机档案中搜索和检索文档。

事实上,当我们需要从档案中检索文档时,如果我们不想花时间滚动浏览无休止的记录列表,我们需要使用搜索键 当文档被输入管理系统或保存系统时,这些搜索关键字由与文档关联的元数据表示。 这些元数据,例如日期、主题、文档编号、增值税号等,是我们用来在正确的时间检索正确的文档的工具。

用于文档管理和保存的元数据

在实践中,伴随文档的元数据集首先在文档管理系统中,然后在保存系统中,是根据精确的标准和标准构建的,并与文档本身相关联。 这就像一个文件夹背面的信息,让我们了解我们是否会在该文件夹中找到我们正在寻找的文档。

尽管一组元数据可能由各种各样的信息组成,但当目标是确保按照现行法规进行有效管理和保存时,有必要遵守精确的标准和标准。

正如我们所提到的,元数据可以根据其功能进行细分。

描述性元数据

描述性元数据,很容易猜到,旨在描述与其相关联的文档或数字对象,以方便其搜索和检索 指定文档主题的信息是描述性元数据。

行政和管理元数据

另一方面,此元数据提供有关文档已经或必须进行的处理的信息,以确保其长期保存完整性真实性 行政和管理元数据可以是提供有关文档访问权限信息的元数据,也可以是指示文档应保存多长时间的元数据。

结构元数据

最后,结构化元数据提供的信息使得可以在保存系统中定位文档、定义文档的内部结构或识别与其他文档的关系。 例如,结构化元数据允许一个文档链接到它所属的计算机文件,从而在两个对象之间建立稳定的关系。

行业法规的作用

因此,某些元数据必须始终存在,因为它们的存在对于检索文档是必不可少的; 其他人必须在场,因为它们可以保证文档的完整性,而其他人必须在场,因为他们将文档置于上下文中并帮助正确地将其与其他文档相关联。

此外,法规还要求其他元数据,正是因为它们的作用非常重要。

关于电子文档的创建、管理和保存AgID 指南确定了一组精确的强制性最低元数据,这些元数据必须与电子文档、电子管理文档和电子文档聚合(例如电子文件)相关联。 必须始终存在最低限度的强制性元数据,以确保合法的存储。

在某些情况下,除了意大利数字机构指南外,还有特定的行业法规。

与财政和税收相关的文件就是这种情况,例如发票、运输文件、订单和会计登记簿。 在这种情况下,一些规范,例如 DPR 600/72 和 2014 年 6 月 17 日的部长令,对这些文件类别以及元数据的保存方法提供了准确的指示。 2014 年 6 月 17 日的 DM 第 3 条规定,在与这些特定文件相关的元数据中,姓名、面额税码、增值税号、日期必须包含在文件本身中。 这是因为这些信息和它们之间的关联被认为是必不可少的,以确保检索文件以便将它们复制给当局。

这是一个简单的例子,展示了行业法规如何经常进行干预,提供了在讨论数字保存时必须牢记的精确指示

新 AgID 指南的影响

最近生效的关于 IT 文档的新 AgID 指南使元数据问题成为焦点。

新指南修改了与 IT 文档相关联的最低强制性元数据系统,到目前为止,该系统仅限于 6 个强制性元数据。 新标准实际上使最小元数据的数量翻了一番,要求必须增强新的信息; 对于所有组织来说,这并不总是容易识别的。

这种巨大的变化迫使公司和专业保存提供商对其系统进行重大升级,以便能够处理新结构。

超出最低限度的强制性元数据

当然,除了各种法规要求的最低元数据之外,我们的元数据集中始终可以包含其他信息,这些信息在特定的业务环境中很有用,并支持额外的研究、管理或结构功能。

同时,当我们想用其他元素丰富元数据集时,最好至少遵循一些基本标准,以避免超出需要的字段扩散和任何不必要的复杂化。

首先,最好确定我们需要确保的功能,例如,我们最常用于检索特定类型文档的搜索键,因此,我们需要什么元数据。 其中一些信息可能已经是最小元数据集的一部分,例如日期或主题; 其他信息,可能与特定背景或既定商业惯例特别相关,可能会丢失,将其包括在内可能很有用。

然而,“少即是多”的规则经常适用:添加大量我们永远不会或几乎不会用于搜索特定文档的信息是没有意义的; 最好专注于一些但有意义的信息。 从长远来看,过于丰富和复杂的结构可能会变得难以管理,并且会适得其反,不必要地使操作员的工作复杂化并增加出错的风险。

最后,最好为我们打算添加的元数据分配“标签”,即,使主题立即清晰并识别我们应该从该元数据中获得的信息的名称。 出于几个原因,这是必不可少的。

首先,它方便了操作员的工作,降低了配置或编译错误的风险。

其次,随着我们进入数字保存的世界,清晰度至关重要。 如果我们需要将档案从一个保存服务提供商转移到另一个,也许几年后,使用不明确的元数据可能会导致许多问题,并破坏保存包中索引的互操作性可理解性,使其变得更加困难执行任务。