RTO 与 RPO:为什么恢复目标对于 IT 成功很重要

已发表: 2023-09-07

企业意识到 IT 停机会造成更高的成本。

公司必须考虑停机的影响,并专注于保持业务运营的连续性。 为此,需要实施适当的业务连续性计划,以最大限度地减少停机时间或完全避免停机。 通过这种方式,公司可以确保其 IT 基础设施具有弹性。

在讨论业务停机时,您经常会听到恢复时间目标 (RTO) 和恢复点目标 (RPO)。 对于每个企业来说,全面了解 RTO 和 RPO 以确保从灾难中快速恢复至关重要。

选择正确的灾难恢复即服务 (DRaaS) 软件使企业能够实施强大的解决方案,以最小的数据丢失满足其 RTO 和 RPO 目标。

在本文中,我们将讨论如何衡量 RTO 和 RPO、这些指标在备份业务连续性计划中的作用,以及如何定义和实现企业的 RTO 和 RPO 目标。

什么是恢复时间目标 (RTO)?

恢复时间目标 (RTO)是一个关键指标,可帮助您计算系统或应用程序在停机后需要多快恢复,以免对业务运营产生重大影响。 简而言之,RTO 是衡量您可以容忍多少停机时间的指标。

如果发生意外中断,一两个系统可能会出现故障,并且您将面临停机,直到问题得到解决。 这使您面临这样的情况:您需要确定需要恢复系统的时间,以便您的业务运营不会中断。 这就是 RTO 发挥作用的地方。

定义 RTO 涉及了解每个系统的容忍停机时间,并且对于每个应用程序,您可能会有不同的 RTO。 定义 RTO 指标后,您就可以开始制定恢复计划,其中包括从停机中成功快速恢复所需的恢复策略和技术。

什么是恢复点目标 (RPO)?

恢复点目标 (RPO)是您为企业可以承受并继续运行而不对业务运营产生任何影响的数据丢失量设置的指标。

为了确定RPO,您需要评估数据的重要性,以了解是否需要恢复全部数据或部分数据,甚至可能存在相对不太重要的数据,不需要恢复。 基于此,您将能够为您的系统定义 RPO:数据的关键性越高,RPO 的值应该越小。

确定 RPO 是备份计划的重要组成部分,因为它可以帮助您根据数据的重要性设置备份数据的频率。

RTO 和 RPO 的区别

RTO 和 RPO 是与备份和灾难恢复计划相关的重要元素。 RTO 和 RPO 都是以时间为单位定义和测量的。 尽管 RTO 和 RPO 听起来很相似,但存在一些主要区别:

恢复时间目标 (RTO)

恢复点目标 (RPO)

与恢复之前的可容忍停机时间相关。

与可容忍的数据丢失有关。

与恢复所需的时间有关。

与备份频率有关。

与使用最新数据恢复正常有关。

与最新恢复的数据如何有关。

专注于实现目标所需的恢复技术,包括恢复整个系统或仅恢复应用程序或更细粒度的级别。

专注于以适当的时间间隔自动执行系统备份。

RTO 与 RPO:如何最大限度地减少业务停机时间

IT 停机的原因有多种,例如系统崩溃、网络或应用程序故障、勒索软件攻击造成的数据丢失或自然灾害造成的站点灾难。 如果发生任何上述不可预见的情况,您的流程可能会停止,并可能导致您付出更多代价。

应用程序至关重要并且需要始终可用。 您业务的关键应用程序发生故障会导致应用程序服务中断,还会导致数据丢失。 这会对您的短期和长期业务运营产生直接影响,并影响您的生产力、收入和品牌。 在某些极端情况下,它甚至可能导致您的公司倒闭。

应用程序的容忍停机时间可能因业务而异,但这里的关键因素是通过快速恢复应用程序的可用性来减少停机时间。

为了让您的系统及时启动并运行,每个企业都需要制定可靠的数据保护策略,即备份和灾难恢复计划。 为您的企业选择备份和灾难恢复计划时,您应该寻找提供更短 RTO 和 RPO 的解决方案。 这使您可以在需要时恢复系统,从而最大限度地减少停机时间并确保业务连续性。

忽视 RTO 和 RPO 指标的风险

如果正确评估和定义 RTO 和 RPO 指标,将帮助您最大限度地降低与停机相关的风险。 这些指标应与您的业务恢复目标和服务级别协议 (SLA) 管理保持一致。

如果您没有正确定义 RTO 和 RPO,则可能会导致从轻微到严重的任何级别的风险。 此外,您将无法从所需的时间点恢复数据,这可能会导致数据丢失并中断业务流程。 最重要的是,您将无法在要求的时间内启动系统。

在上述两种情况下,操作中断都可能导致生产力损失。 在最坏的情况下,这将导致收入损失,并可能造成商业声誉损失等严重影响。

如何通过备份和灾难恢复计划实现 RTO 和 RPO

您正在寻找的任何备份和灾难恢复解决方案都将在其 SLA 中指定其有保证的 RPO 和 RTO。 始终确保您选择的备份和灾难恢复解决方案能够确保您的恢复目标:RTO 和 RPO。

备份和灾难恢复解决方案提供多种功能来实现您的业务 RTO 和 RPO 目标。 我们将介绍您在备份和灾难恢复解决方案中需要的一些重要功能,这些功能将帮助您的企业实现接近于零的 RTO 和 RPO。

灵活的调度策略

当今的备份和灾难恢复解决方案提供灵活的调度策略来为您的应用程序定义 RPO。 计划策略允许您定期运行自动备份,例如每隔几分钟、每隔几个小时或每天一次。 这使得 RPO 的实施变得更加容易。

持续数据保护 (CDP)可确保每次对系统/应用程序进行更改时,都会立即备份或复制。 这解决了企业面临丢失两次计划备份之间生成的数据风险的问题,并允许您实现零 RPO。 但是,当您为关键工作负载启用 CDP 时,可能会出现性能或稳定性问题,因为它会占用更多资源。 由于这些原因,CDP 被广泛用于文件级备份。

近连续数据保护可以设置为接近零并定期运行。 这接近实现CDP的效果,并且可以用于执行使用基于快照的技术或其他技术的映像级备份/复制。 市场上的大多数备份和灾难恢复解决方案都可以让您的关键系统在不到 15 分钟的时间内实现接近于零的 RPO。

即时恢复能力

您的企业需要一个选项来实现可通过即时恢复实现的接近于零的 RTO 目标。

作为备份和灾难恢复计划的一部分,每个企业都需要的即时恢复功能之一是能够直接从备份存储立即启动备份计算机作为就绪状态虚拟机以继续其业务运营。

您可以使用备份存储上仍处于加密和压缩格式的备份数据,从最新备份或任何时间点立即启动虚拟环境中的计算机。 现在,您可以在几分钟内启动并运行关键系统,并确保业务连续性,同时实现接近零的 RTO。

这样,您就可以最大程度地减少停机时间,并且所有第 1 层关键任务系统都可以继续运行,不会对业务产生影响。 稍后,您可以将立即启动的虚拟机迁移到生产环境以进行永久恢复。

粒度回收

粒度恢复在备份和灾难恢复计划中发挥着重要作用。 它使您能够仅恢复所需的数据。

使用此选项,您可以有选择地直接从备份中还原文件或应用程序项目。 如果您意外删除了某个文件,您可以轻松选择并恢复该特定文件。 此外,您可以立即恢复特定邮件或邮箱,而无需恢复整个数据库或应用程序。 现在,您将能够实现几分钟的 RTO。 这可以节省时间和资源,因为无需每次都恢复整个计算机来恢复单个项目。

具有故障转移功能的实时复制

实时复制允许您在另一个站点上创建生产工作负载的精确副本,并经常将更改复制到副本计算机,从而配置接近于零的 RPO。

如果您的源计算机由于任何中断或损坏而变得不可用,您可以立即执行故障转移操作,将生产操作无缝切换到副本计算机。 在没有任何停机或影响的情况下,您将能够继续业务运营,同时实现接近零的 RTO 目标。 在 RTO 和 RPO 都接近于零的情况下,您可以利用复制和故障转移功能并保持生产工作负载始终可用。

用于灾难恢复的异地副本

没有人能够预测灾难。 如果出现全站点故障,甚至您的本地备份也会变得无法访问,并使您的业务面临风险且无法恢复数据。

因此,最好制定一个灾难恢复计划,允许您创建备份的额外副本并将其存储在远程位置,该位置可以是本地数据中心或公共云。 通过异地备份,您可以在发生灾难时恢复系统并轻松实现业务恢复目标。

防御、恢复并重复

备份和灾难恢复计划是处理灾难场景的极其重要的部分。 如上所述,在发生灾难时确保操作连续性的主要方面之一是在备份和灾难恢复计划中正确指定 RTO 和 RPO 指标。

确定 RTO 和 RPO 值,实施满足您的业务 SLA 的解决方案(例如 SLA 监控工具),并保持您的业务始终可用。