RTO e RPO: perché gli obiettivi di ripristino sono importanti per il successo dell'IT

Pubblicato: 2023-09-07

Le aziende sono consapevoli che i tempi di inattività dell'IT costeranno di più.

Le aziende devono considerare le implicazioni dei tempi di inattività e concentrarsi sul mantenimento della continuità delle operazioni aziendali. Per fare ciò, è necessario implementare un adeguato piano di continuità aziendale per consentire di ridurre al minimo i tempi di inattività o di evitarli completamente. In questo modo le aziende possono garantire che la loro infrastruttura IT sia resiliente.

Quando si parla di tempi di inattività aziendale, si sente spesso parlare di obiettivi del tempo di ripristino (RTO) e di obiettivi del punto di ripristino (RPO). È fondamentale per ogni azienda avere una conoscenza completa di RTO e RPO per garantire un rapido ripristino da un disastro.

La scelta del giusto software DRaaS (Disaster Recovery as a Service) consente alle aziende di implementare soluzioni potenti che soddisfano gli obiettivi RTO e RPO con una perdita di dati minima.

In questo articolo discuteremo di come misurare RTO e RPO, del ruolo di questi parametri in un piano di continuità aziendale di backup e di come definire e raggiungere gli obiettivi RTO e RPO della tua azienda.

Qual è il Recovery Time Objective (RTO)?

L'obiettivo del tempo di ripristino (RTO) è una metrica chiave che aiuta a calcolare la rapidità con cui un sistema o un'applicazione deve essere ripristinato dopo un periodo di inattività, in modo che non vi sia un impatto significativo sulle operazioni aziendali. In breve, l'RTO è la misura del tempo di inattività che puoi tollerare.

In caso di interruzioni impreviste, uno o due sistemi potrebbero guastarsi e dovrai affrontare tempi di inattività finché il problema non verrà risolto. Ciò ti mette in una situazione in cui devi determinare il tempo entro il quale è necessario ripristinare il sistema in modo che le tue operazioni aziendali non si interrompano. È qui che entra in gioco l'RTO.

La definizione dell'RTO implica la comprensione della tolleranza dei tempi di inattività di ciascun sistema e, per ciascuna delle tue applicazioni, probabilmente avrai RTO diversi. Una volta definita la metrica RTO, sei pronto per pianificare il ripristino che include la strategia di ripristino e la tecnologia di cui hai bisogno per un ripristino rapido e efficace dai tempi di inattività.

Cos'è l'obiettivo del punto di ripristino (RPO)?

Un obiettivo del punto di ripristino (RPO) è una metrica impostata per la quantità di perdita di dati che la tua azienda può sopportare e continuare a funzionare senza alcun effetto sulle operazioni aziendali.

Per determinare l'RPO, è necessario valutare la criticità dei dati per sapere se è necessario recuperarli tutti o parte di essi e potrebbero anche esserci dati relativamente meno significativi che non necessitano di essere ripristinati. In base a questo potrai definire l'RPO per il tuo sistema: maggiore è la criticità dei dati, minore dovrà essere il valore dell'RPO.

Determinare l'RPO è una parte essenziale di un piano di backup poiché ti aiuta a impostare la frequenza con cui desideri eseguire il backup dei dati in base alla loro criticità.

Differenze tra RTO e RPO

RTO e RPO sono elementi importanti associati ai piani di backup e ripristino di emergenza. Sia RTO che RPO sono definiti e misurati in unità di tempo. Sebbene RTO e RPO possano sembrare simili, esistono alcune differenze sostanziali:

Obiettivo del tempo di recupero (RTO)

Obiettivo del punto di ripristino (RPO)

Relativo al tempo di inattività tollerabile fino al ripristino.

Relativo alla perdita di dati tollerabile.

Relativo al tempo impiegato per il ripristino.

Relativo alla frequenza di backup.

Relativo al ripristino della normalità con i dati più recenti.

Relativo a come saranno gli ultimi dati recuperati.

Incentrato sulle tecnologie di ripristino necessarie per raggiungere gli obiettivi, incluso il ripristino dell'intero sistema o solo dell'applicazione o a un livello più granulare.

Focalizzato sull'automazione dei backup per il tuo sistema a intervalli adeguati.

RTO vs. RPO: come ridurre al minimo i tempi di inattività aziendale

I tempi di inattività dell'IT si verificano a causa di molteplici motivi, come arresti anomali del sistema, guasti della rete o delle applicazioni, perdita di dati dovuta a un attacco ransomware o disastri del sito dovuti a calamità naturali. Se si verifica uno degli imprevisti sopra menzionati, può interrompere i processi e costare di più.

Le applicazioni sono cruciali e devono essere sempre disponibili. Il guasto di un'applicazione critica della vostra azienda porta all'interruzione del servizio applicativo e comporta anche la perdita di dati. Ciò ha un impatto diretto sulle operazioni aziendali sia a breve che a lungo termine e influisce sulla produttività, sui ricavi e sul marchio. In alcuni casi estremi, ciò può addirittura causare il fallimento della tua azienda.

Il tempo di inattività tollerato da un'applicazione può variare a seconda dell'azienda, ma in questo caso il fattore critico è ridurre i tempi di inattività ripristinando rapidamente la disponibilità dell'applicazione.

Per rendere operativi i propri sistemi in modo tempestivo, ogni azienda deve disporre di una solida strategia di protezione dei dati, ovvero di un piano di backup e ripristino di emergenza. Quando selezioni un piano di backup e ripristino di emergenza per la tua azienda, dovresti cercare una soluzione che offra RTO e RPO più brevi. Ciò consente di ottenere tempi di inattività minimi e garantire la continuità aziendale ripristinando il sistema quando necessario.

Rischi di ignorare le metriche RTO e RPO

Le metriche RTO e RPO ti aiuteranno a ridurre al minimo i rischi associati ai tempi di inattività se li valuti e li definisci correttamente. Queste metriche dovrebbero essere in linea con gli obiettivi di ripresa aziendale e con la gestione del contratto di servizio (SLA).

Se non si definiscono correttamente RTO e RPO, ciò potrebbe portare a qualsiasi livello di rischio, da meno a grave. Inoltre, non sarà possibile ripristinare i dati dal momento richiesto, il che potrebbe comportare la perdita di dati e l'interruzione dei processi aziendali. Oltre a ciò, non sarai in grado di ripristinare il tuo sistema entro il tempo richiesto.

In entrambi i casi sopra menzionati, l’interruzione delle operazioni può comportare una perdita di produttività. Nel peggiore dei casi, ciò comporterà una perdita di entrate e può causare gravi conseguenze come la perdita della reputazione aziendale.

Come ottenere RTO e RPO con un piano di backup e disaster recovery

Qualsiasi soluzione di backup e ripristino di emergenza che stai esaminando specificherà l'RPO e l'RTO garantiti nel relativo SLA. Assicurati sempre che la soluzione di backup e ripristino di emergenza scelta garantisca gli obiettivi di ripristino: RTO e RPO.

Le soluzioni di backup e ripristino di emergenza offrono molteplici funzionalità per raggiungere gli obiettivi RTO e RPO aziendali. Esamineremo alcune delle funzionalità importanti che devi cercare in una soluzione di backup e ripristino di emergenza che aiuterà la tua azienda a raggiungere RTO e RPO prossimi allo zero.

Politiche di pianificazione flessibili

Le odierne soluzioni di backup e ripristino di emergenza offrono policy di pianificazione flessibili per definire l'RPO per le tue applicazioni. Le policy di pianificazione consentono di eseguire un backup automatico a intervalli regolari, ad esempio ogni pochi minuti, ogni poche ore o una volta al giorno. Ciò rende l’implementazione dell’RPO molto più semplice.

La protezione continua dei dati (CDP) garantisce che ogni volta che viene apportata una modifica al sistema/applicazione, ne venga eseguito il backup o la replica istantanea. Ciò risolve il problema per cui le aziende rischiano di perdere i dati generati tra due backup pianificati e consente di raggiungere un RPO pari a zero. Tuttavia, quando abiliti CDP per carichi di lavoro critici, potrebbero verificarsi problemi di prestazioni o stabilità poiché utilizza più risorse. Per questi motivi, CDP è ampiamente utilizzato per i backup a livello di file.

La protezione dei dati quasi continua può essere impostata quasi a zero ed eseguita a intervalli regolari. Questo è vicino al raggiungimento dell'effetto di CDP e può essere abilitato per eseguire backup/replica a livello di immagine che utilizzano la tecnologia basata su snapshot o altro. La maggior parte delle soluzioni di backup e ripristino di emergenza presenti sul mercato consentono di raggiungere un RPO prossimo allo zero inferiore a 15 minuti per il sistema critico.

Funzionalità di ripristino istantaneo

La tua azienda ha bisogno di un'opzione per raggiungere gli obiettivi RTO prossimi allo zero che possono essere raggiunti attraverso il ripristino immediato.

Una delle funzionalità di ripristino istantaneo di cui ogni azienda ha bisogno come parte del proprio piano di backup e ripristino di emergenza è la possibilità di avviare immediatamente la macchina sottoposta a backup direttamente dall'archivio di backup come macchina virtuale pronta per continuare le proprie operazioni aziendali.

Puoi avviare immediatamente una macchina nell'ambiente virtuale dall'ultimo backup o da qualsiasi momento utilizzando i dati di backup ancora in formato crittografato e compresso nell'archivio di backup. Ora puoi avere il tuo sistema critico attivo e funzionante in pochi minuti e garantire la continuità aziendale rispettando un RTO prossimo allo zero.

In questo modo puoi ridurre al minimo i tempi di inattività e tutti i tuoi sistemi mission-critical di livello 1 continuano a funzionare senza alcun impatto sull'azienda. Successivamente, puoi migrare la macchina virtuale avviata istantaneamente alla produzione per il ripristino permanente.

Recupero granulare

Il ruolo del ripristino granulare in un piano di backup e ripristino di emergenza gioca un ruolo significativo. Ti offre la possibilità di ripristinare solo i dati di cui hai bisogno.

Con questa opzione è possibile ripristinare in modo selettivo un file o un elemento dell'applicazione direttamente dal backup. Se hai eliminato accidentalmente un file, puoi facilmente selezionare e ripristinare quel particolare file. Inoltre, puoi ripristinare immediatamente un messaggio di posta o una casella di posta specifica invece di dover ripristinare l'intero database o l'applicazione. Ora sarai in grado di raggiungere un RTO di pochi minuti. Ciò consente di risparmiare tempo e risorse poiché non è necessario ripristinare ogni volta un'intera macchina per recuperare un singolo elemento.

Replica in tempo reale con failover

La replica in tempo reale ti consente di creare una copia esatta dei carichi di lavoro di produzione su un altro sito e di replicare frequentemente le modifiche sulla macchina di replica, configurando un RPO prossimo allo zero.

Se la tua macchina di origine non è più disponibile a causa di un'interruzione o di un danneggiamento, puoi eseguire immediatamente un'operazione di failover che trasferisce senza problemi le operazioni di produzione alla tua macchina di replica. Senza tempi di inattività o impatto, sarai in grado di continuare le tue operazioni aziendali raggiungendo i tuoi obiettivi RTO prossimi allo zero. Nei casi in cui sia l'RTO che l'RPO sono prossimi allo zero, puoi sfruttare le funzionalità di replica e failover e mantenere i carichi di lavoro di produzione sempre disponibili.

Copia offsite per il ripristino di emergenza

Nessuno può prevedere un disastro. Se si verifica un guasto dell'intero sito, anche i backup locali diventano inaccessibili e mettono a rischio la tua azienda senza poter ripristinare i dati.

Per questo motivo è bene dotarsi di un piano di disaster recovery che permetta di creare una copia aggiuntiva del proprio backup e di archiviarla in una posizione remota, che può essere un data center locale o un cloud pubblico. Con i backup offsite è possibile ripristinare il sistema in caso di disastro e raggiungere facilmente gli obiettivi di ripristino aziendali.

Difendi, ripristina e ripeti

I piani di backup e ripristino di emergenza sono una parte estremamente importante nella gestione di uno scenario di emergenza. Come discusso in precedenza, uno degli aspetti principali per garantire la continuità delle operazioni in caso di disastro è specificare correttamente le metriche RTO e RPO nel piano di backup e ripristino di emergenza.

Decidi i valori RTO e RPO, implementa una soluzione che soddisfi i tuoi SLA aziendali, come gli strumenti di monitoraggio degli SLA, e mantieni la tua azienda sempre disponibile.