February 9, 2023

PAPERS

A volte la vita ti colpirà alla testa con un mattone

Quattro aree chiave in cui i backup vanno male

Nonostante la prevalenza di molte forme di protezione dei dati – che vanno dal locale RAID tramite snapshot e replica per mantenere copie nel cloud – i fatti della vita sono che backup è ancora fondamentale per l’informatica.

Questo perché non importa quali altri metodi usi – snapshot, replicae così via – qualsiasi corruzione dei dati viene copiata con essi, quindi è necessaria una buona libreria di backup che vada il più indietro possibile per fare il rollback.

Ma i backup falliscono – e, secondo un recente sondaggio, il tasso di fallimento è un impressionante 37%.

I backup falliscono per una varietà di ragioni, e in questo articolo esaminiamo le cause principali.
Alcune sono inaspettate e non particolarmente evitabili, come il guasto del disco rigido, ma che possono essere mitigate.

Altri possono essere previsti e possono essere mitigati, come i problemi che sorgono dopo le patch o le modifiche ad altre configurazioni.

Poi c’è l’elemento umano, come assicurarsi di impostare correttamente i backup e sapere come funziona il software di backup.

Fallimenti dei media

L’hardware è un fatto imbarazzante della vita nell’IT. Imbarazzante perché può fallire. Per i dischi rigidi, il guasto può arrivare inaspettatamente, anche se per i dischi rotanti è noto che qualcosa come uno su 100 si guasta ogni anno.

Quindi, i backup possono fallire perché le unità falliscono, ma questo può e deve essere mitigato dalla ridondanza come tramite RAID.
Anche le unità a stato solido (SSD) possono fallire, anche se ad un tasso inferiore rispetto agli hard disk (HDD), anche se gli SSD hanno una durata di vita più limitata.
Qui, ancora una volta, la chiave è costruire la ridondanza dell’hardware e il refresh.

Nastro ha i suoi propri meccanismi di guasto, incentrati sugli effetti del tempo e dell’uso sul supporto magnetico stesso e sulla sua relazione con le testine di lettura.

Le istruzioni dei produttori per la conservazione e la manutenzione dei nastri dovrebbero essere seguite, e le peculiarità dei media dovrebbero essere notate – le testine di lettura e i media, per esempio, possono usurarsi insieme in modi che possono non mostrarsi finché non si vogliono recuperare i dati su un’attrezzatura diversa.

Il grande passo avanti quando si tratta di evitare guasti hardware che influenzano i backup è quello di costruire la ridondanza, anche attraverso qualcosa come backup 3-2-1.

Problemi di software

I problemi relativi al software comprendono una vasta gamma di potenziali problemi che possono influenzare il backup.
Una delle fonti più comuni di fallimento del backup è quando i cambiamenti portati dagli aggiornamenti o dalle patch causano problemi la volta successiva che il backup viene eseguito.

Questo può essere dovuto al fatto che gli aggiornamenti o le patch – che spesso comprendono un gran numero di modifiche al software – possono creare incompatibilità con la configurazione del backup. Questo può includere modifiche alle applicazioni che significano che qualcosa è ora non supportato da qualche parte nello stack e aggiornamenti di sicurezza che cambiano o ripristinano le impostazioni che rendono impossibile la connessione dei backup.

Il metodo chiave di mitigazione è quello di essere consapevoli che gli aggiornamenti sono impostati per avere luogo e di essere pronti per il tipo di interruzioni ai backup – e altrove – che possono verificarsi. Le piattaforme di analisi predittiva di alcuni fornitori possono aiutare essendo in grado di prevedere potenziali problemi con particolari configurazioni di aggiornamento e software installati.

A volte il software di backup stesso può fallire. I problemi possono includere servizi associati all’applicazione che non riescono a funzionare, agenti che non si installano correttamente, problemi di connessione, errori di lettura/scrittura e anche cose come i cambiamenti dell’ora legale che influenzano le impostazioni della finestra di backup. Qui è necessario controllare le risorse di supporto dei fornitori per le soluzioni.

Ambienti virtualizzati possono portare i loro problemi particolari. La creazione, la migrazione e lo smantellamento delle macchine virtuali (VM) e dei loro dati comporta necessariamente molti cambiamenti e il software di backup deve tenere traccia di un panorama potenzialmente molto complesso.

I fallimenti che circondano il backup possono essere causati da cataloghi corrotti, permessi insufficienti e cose come Volume Shadow Copy Service (VSS) e corruzione del disco rigido virtuale (VHD).

L’emergere di dell’uso diffuso dei contenitori è probabile che porti ulteriori complicazioni a causa dei loro cicli di vita in rapido movimento.

Errore umano

È un fatto fondamentale che gli esseri umani sono responsabili della supervisione dell’implementazione e del funzionamento dei processi di backup, non importa quanto automatizzati, quindi c’è sempre spazio per errore umano nel processo.
La chiave è ridurre la probabilità che questo influenzi i vostri backup.

La configurazione dei backup, la conoscenza dei prodotti di backup in uso e gli strumenti che includono che possono aiutare ad automatizzare le attività è il punto di partenza. Ottenere la giusta configurazione e sapere come usare gli strumenti incorporati per scoprire set di dati, applicazioni, servizi e altre dipendenze è la chiave per il successo dei backup e, forse più importante, per il successo dei ripristini.

Dopo tutto, il backup non è nulla senza la capacità di recuperare i dati, che si tratti di un singolo file o di un intero sistema. È più probabile in quest’ultimo caso che tu abbia bisogno di essere consapevole delle dipendenze critiche e di esserti assicurato che siano protette e ripristinabili.

Qui, il fornitore può avere alcuni strumenti di scoperta utili, ma fate attenzione a sapere cosa potrebbero non aver scoperto in termini di dipendenza. Un’applicazione principale può avere dipendenze come il controllo dell’accesso che sarà vitale per farla funzionare di nuovo, per esempio.

Un metodo chiave per essere preparati quando si tratta dell’elemento umano è quello di effettuare test regolari e costruire politiche e procedure per coprire le cose che potrebbero cadere attraverso le lacune che le macchine non possono affrontare.

Guasti alle infrastrutture

I backup devono attraversare tutti i tipi di infrastrutture, quindi un guasto ovunque può influenzare il backup e il recupero, e potenzialmente quest’ultimo è ancora più vulnerabile.

L’infrastruttura può comprendere unità e librerie a nastro, array di dischi, server di backup, reti e sempre più spesso il tuo collegamento al cloud.

La chiave per mitigare i problemi dell’infrastruttura è, ancora una volta, la ridondanza. Quindi, per le parti dell’infrastruttura che gestite, assicuratevi di avere la ridondanza incorporata, sia a livello di media, server o connettività.

Per quelle su cui non avete il controllo diretto, come le connessioni WAN (Wide Area Network), le risorse cloud e così via, assicuratevi di avere la ridondanza incorporata. accordi sui livelli di servizio (SLA) devono essere in atto.
E assicurarsi che l’infrastruttura sia a posto per effettuare un ritorno al lavoro in caso di disastro.

Dopo la pandemia, l’enorme aumento della necessità di sostenere il lavoro a distanza avrà messo in risalto i problemi dell’infrastruttura. Ha portato la necessità di esaminare la capacità dei prodotti software esistenti di gestire il backup dei dispositivi periferici, o anche la necessità di acquistare un prodotto specializzato per questo compito.