RTO와 RPO: IT 성공에 복구 목표가 중요한 이유

게시 됨: 2023-09-07

기업은 IT 가동 중단으로 인해 비용이 더 많이 든다는 것을 알고 있습니다.

기업은 다운타임이 미치는 영향을 고려하고 비즈니스 운영의 연속성을 유지하는 데 집중해야 합니다. 이를 위해서는 다운타임을 최소화하거나 완전히 방지할 수 있는 적절한 비즈니스 연속성 계획을 구현해야 합니다. 이러한 방식으로 기업은 IT 인프라의 탄력성을 보장할 수 있습니다.

비즈니스 다운타임을 논의할 때 RTO(복구 시간 목표)와 RPO(복구 지점 목표)에 대해 자주 듣게 됩니다. 재해로부터 신속한 복구를 보장하려면 모든 기업이 RTO 및 RPO를 완벽하게 이해하는 것이 중요합니다.

올바른 DRaaS(서비스형 재해 복구) 소프트웨어를 선택하면 기업은 데이터 손실을 최소화하면서 RTO 및 RPO 목표를 충족하는 강력한 솔루션을 구현할 수 있습니다.

이 문서에서는 RTO 및 RPO를 측정하는 방법, 백업 비즈니스 연속성 계획에서 이러한 지표의 역할, 비즈니스의 RTO 및 RPO 목표를 정의하고 달성하는 방법에 대해 설명합니다.

RTO(복구 시간 목표)란 무엇입니까?

RTO(복구 시간 목표)는 비즈니스 운영에 큰 영향을 미치지 않도록 다운타임 후 시스템이나 애플리케이션을 얼마나 빨리 복구해야 하는지 계산하는 데 도움이 되는 핵심 지표입니다. 간단히 말해서 RTO는 허용할 수 있는 가동 중지 시간의 척도입니다.

예상치 못한 가동 중단이 발생할 경우 시스템 한두 대에 장애가 발생할 수 있으며, 이 문제가 해결될 때까지 가동 중지 시간이 발생하게 됩니다. 이로 인해 비즈니스 운영이 중단되지 않도록 시스템을 복원해야 하는 시간을 결정해야 하는 상황이 됩니다. 이것이 바로 RTO가 등장하는 곳입니다.

RTO를 정의하려면 각 시스템의 허용 가동 중지 시간을 이해해야 하며, 각 애플리케이션마다 RTO가 다를 수 있습니다. RTO 지표를 정의하고 나면 가동 중지 시간으로부터 성공적이고 신속한 복원을 위해 마련해야 하는 복구 전략 및 기술을 포함하는 복구 계획을 세울 수 있습니다.

RPO(복구 지점 목표)란 무엇입니까?

RPO(복구 지점 목표)는 비즈니스가 견딜 수 있고 비즈니스 운영에 영향을 주지 않고 계속 작동할 수 있는 데이터 손실의 양에 대해 설정한 지표입니다.

RPO를 결정하려면 데이터의 중요성을 평가하여 데이터 전체를 복구해야 하는지 아니면 일부를 복구해야 하는지 파악해야 하며, 상대적으로 덜 중요하고 복원할 필요가 없는 데이터도 있을 수 있습니다. 이를 바탕으로 시스템의 RPO를 정의할 수 있습니다. 즉, 데이터의 중요도가 높을수록 RPO 값은 낮아져야 합니다.

RPO 결정은 중요도에 따라 데이터를 백업할 빈도를 설정하는 데 도움이 되므로 백업 계획의 필수 부분입니다.

RTO와 RPO의 차이점

RTO 및 RPO는 백업 및 재해 복구 계획과 관련된 중요한 요소입니다. RTO와 RPO는 모두 시간 단위로 정의되고 측정됩니다. RTO와 RPO는 비슷하게 들리지만 몇 가지 중요한 차이점이 있습니다.

복구 시간 목표(RTO)

복구 지점 목표(RPO)

복구까지 허용 가능한 가동 중지 시간과 관련됩니다.

허용 가능한 데이터 손실과 관련됩니다.

복원하는 데 걸린 시간과 관련됩니다.

백업 빈도와 관련됩니다.

최신 데이터로 정상 복원하는 것과 관련됩니다.

최근에 복구된 데이터가 어떻게 될 것인지와 관련됩니다.

전체 시스템, 애플리케이션만 복원 또는 보다 세부적인 수준 복원을 포함하여 목표를 달성하는 데 필요한 복구 기술에 중점을 둡니다.

적절한 간격으로 시스템 백업을 자동화하는 데 중점을 둡니다.

RTO와 RPO: 비즈니스 다운타임을 최소화하는 방법

IT 다운타임은 시스템 충돌, 네트워크 또는 애플리케이션 오류, 랜섬웨어 공격으로 인한 데이터 손실, 자연재해로 인한 사이트 재해 등 다양한 이유로 인해 발생합니다. 앞서 언급한 예상치 못한 일이 발생하면 프로세스가 중단되고 더 많은 비용이 발생할 수 있습니다.

애플리케이션은 매우 중요하며 항상 사용 가능해야 합니다. 비즈니스에 중요한 애플리케이션이 실패하면 애플리케이션 서비스가 중단되고 데이터 손실도 발생합니다. 이는 단기 및 장기적으로 비즈니스 운영에 직접적인 영향을 미치며 생산성, 수익 및 브랜드에 영향을 미칩니다. 극단적인 경우에는 회사가 폐업할 수도 있습니다.

애플리케이션의 허용 가동 중지 시간은 비즈니스에 따라 다를 수 있지만 여기서 중요한 요소는 애플리케이션의 가용성을 신속하게 복원하여 가동 중지 시간을 줄이는 것입니다.

적시에 시스템을 가동하고 실행하려면 모든 기업은 견고한 데이터 보호 전략, 즉 백업 및 재해 복구 계획을 마련해야 합니다. 귀하의 비즈니스에 맞는 백업 및 재해 복구 계획을 선택할 때 더 짧은 RTO 및 RPO를 제공하는 솔루션을 찾아야 합니다. 이를 통해 가동 중지 시간을 최소화하고 필요할 때 시스템을 복원하여 비즈니스 연속성을 보장할 수 있습니다.

RTO 및 RPO 지표를 무시할 때의 위험

RTO 및 RPO 지표는 올바르게 평가하고 정의할 경우 가동 중지 시간과 관련된 위험을 최소화하는 데 도움이 됩니다. 이러한 지표는 비즈니스 복구 목표 및 SLA(서비스 수준 계약) 관리와 일치해야 합니다.

RTO와 RPO를 적절하게 정의하지 않으면 경미한 위험부터 심각한 위험까지 모든 수준의 위험이 발생할 수 있습니다. 또한 필요한 시점부터 데이터를 복원할 수 없으므로 데이터 손실이 발생하고 비즈니스 프로세스가 중단될 수 있습니다. 게다가 필요한 시간 내에 시스템을 가동할 수도 없습니다.

위에서 언급한 두 경우 모두 작업 중단으로 인해 생산성이 저하될 수 있습니다. 최악의 경우 매출 손실로 이어질 수 있으며, 비즈니스 평판 손실 등 심각한 결과를 초래할 수 있습니다.

백업 및 재해 복구 계획을 통해 RTO 및 RPO를 달성하는 방법

귀하가 보고 있는 모든 백업 및 재해 복구 솔루션은 SLA에 보장된 RPO 및 RTO를 지정합니다. 선택한 백업 및 재해 복구 솔루션이 복구 목표인 RTO 및 RPO를 보장하는지 항상 확인하세요.

백업 및 재해 복구 솔루션은 비즈니스 RTO 및 RPO 목표를 달성하기 위한 다양한 기능을 제공합니다. 비즈니스가 거의 0에 가까운 RTO 및 RPO를 달성하는 데 도움이 되는 백업 및 재해 복구 솔루션에서 찾아야 할 몇 가지 중요한 기능을 살펴보겠습니다.

유연한 일정 정책

오늘날의 백업 및 재해 복구 솔루션은 애플리케이션에 대한 RPO를 정의하기 위한 유연한 일정 정책을 제공합니다. 예약 정책을 사용하면 몇 분마다, 몇 시간마다 또는 하루에 한 번과 같이 정기적인 간격으로 자동 백업을 실행할 수 있습니다. 이렇게 하면 RPO 구현이 훨씬 쉬워집니다.

지속적인 데이터 보호(CDP)는 시스템/애플리케이션에 변경 사항이 있을 때마다 즉시 백업되거나 복제되도록 보장합니다. 이를 통해 기업이 두 번의 예약된 백업 사이에 생성된 데이터가 손실될 위험이 있는 문제를 해결하고 RPO를 0으로 달성할 수 있습니다. 그러나 중요한 워크로드에 대해 CDP를 활성화하면 더 많은 리소스를 활용하므로 성능이나 안정성 문제가 발생할 수 있습니다. 이러한 이유로 CDP는 파일 수준 백업에 널리 사용됩니다.

거의 연속적인 데이터 보호를 거의 0으로 설정하고 정기적으로 실행할 수 있습니다. 이는 CDP 효과에 가깝고 스냅샷 기반 기술 등을 사용하는 이미지 수준 백업/복제를 수행하는 데 사용할 수 있습니다. 시중에 나와 있는 대부분의 백업 및 재해 복구 솔루션을 사용하면 중요한 시스템에 대해 15분 미만의 거의 0에 가까운 RPO를 달성할 수 있습니다.

즉각적인 복구 기능

귀하의 비즈니스에는 즉각적인 복구를 통해 달성할 수 있는 거의 0에 가까운 RTO 목표를 달성할 수 있는 옵션이 필요합니다.

백업 및 재해 복구 계획의 일부로 모든 기업에 필요한 즉각적인 복구 기능 중 하나는 백업 스토리지에서 직접 백업된 시스템을 준비된 상태의 가상 머신으로 즉시 부팅하여 비즈니스 운영을 계속하는 기능입니다.

최신 백업 또는 백업 스토리지에 여전히 암호화되고 압축된 형식으로 남아 있는 백업 데이터를 사용하여 어느 시점에서나 가상 환경의 머신을 즉시 시작할 수 있습니다. 이제 몇 분 안에 중요한 시스템을 가동 및 실행할 수 있으며 거의 ​​0에 가까운 RTO를 충족하면서 비즈니스 연속성을 보장할 수 있습니다.

이를 통해 가동 중지 시간을 최소화할 수 있으며 모든 Tier 1 미션 크리티컬 시스템은 비즈니스에 영향을 주지 않고 계속 작동할 수 있습니다. 나중에 영구 복구를 위해 즉시 부팅된 가상 머신을 프로덕션으로 마이그레이션할 수 있습니다.

세분화된 복구

백업 및 재해 복구 계획에서 세분화된 복구의 역할은 중요한 역할을 합니다. 필요한 데이터만 복원할 수 있는 기능을 제공합니다.

이 옵션을 사용하면 백업에서 직접 파일이나 애플리케이션 항목을 선택적으로 복원할 수 있습니다. 실수로 파일을 삭제한 경우 해당 파일을 쉽게 선택하고 복원할 수 있습니다. 또한 전체 데이터베이스나 애플리케이션을 복구할 필요 없이 특정 메일이나 편지함을 즉시 복원할 수 있습니다. 이제 몇 분의 RTO를 달성할 수 있습니다. 이렇게 하면 개별 항목을 복구하기 위해 매번 전체 머신을 복원할 필요가 없으므로 시간과 리소스가 절약됩니다.

장애 조치를 통한 실시간 복제

실시간 복제를 사용하면 다른 사이트에 프로덕션 워크로드의 정확한 복사본을 생성하고 변경 사항을 복제본 시스템에 자주 복제하여 거의 0에 가까운 RPO를 구성할 수 있습니다.

중단이나 손상으로 인해 소스 머신을 사용할 수 없게 되면 프로덕션 작업을 복제본 머신으로 원활하게 전환하는 장애 조치 작업을 즉시 수행할 수 있습니다. 가동 중지 시간이나 영향 없이 거의 0에 가까운 RTO 목표를 달성하면서 비즈니스 운영을 계속할 수 있습니다. RTO와 RPO가 모두 0에 가까운 경우 복제 및 장애 조치 기능을 활용하고 프로덕션 워크로드를 항상 가용성으로 유지할 수 있습니다.

재해 복구를 위한 오프사이트 복사본

재난은 누구도 예측할 수 없습니다. 전체 사이트에 장애가 발생하면 로컬 백업에도 액세스할 수 없게 되고 데이터를 복구할 수 없어 비즈니스가 위험에 처하게 됩니다.

이러한 이유로 백업의 추가 복사본을 만들고 이를 로컬 데이터 센터나 공용 클라우드 등 원격 위치에 저장할 수 있는 재해 복구 계획을 세우는 것이 좋습니다. 오프사이트 백업을 사용하면 재해 발생 시 시스템을 복구하고 비즈니스 복구 목표를 쉽게 달성할 수 있습니다.

방어, 복원, 반복

백업 및 재해 복구 계획은 재해 시나리오를 처리하는 데 매우 중요한 부분입니다. 위에서 설명한 것처럼 재해 발생 시 작업 연속성을 보장하는 주요 측면 중 하나는 백업 및 재해 복구 계획에서 RTO 및 RPO 측정항목을 올바르게 지정하는 것입니다.

RTO 및 RPO 값을 결정하고, SLA 모니터링 도구와 같이 비즈니스 SLA를 충족하는 솔루션을 구현하고, 비즈니스를 항상 가용성으로 유지하세요.