In questo articolo che vi proponiamo qui di seguito Cesar Cid de Rivera (in foto), International VP of Sales Engineering di Commvault, riflette sui diversi metodi di archiviazione dei dati non strutturati.
Buona lettura.
I dati non strutturati non seguono un modello convenzionale: non hanno formati rigidi che consentono di essere facilmente riconosciuti, archiviati e gestiti in un database. Se quelli strutturati sono tipicamente generati dai sistemi, i dati non strutturati sono solitamente creati dalle persone e comprendono al loro interno elementi complessi e molto diversi tra loro, da documenti Word e PowerPoint fino a file video e post sui social media.
La maggior parte dei dati che vengono attualmente generati è non strutturata e ricerche di analisti come Gartner e IDC indicano una percentuale intorno all’80% rispetto all’insieme di tutti i dati. Ma perché sono così preziosi? Semplicemente per le informazioni che contengono e per il modo in cui possono essere utilizzate a vantaggio dell’azienda. Ogni nuova risorsa creata o email inviata rientra nella categoria dei dati non strutturati e questo contribuisce alla crescita e al successo di un’organizzazione.
Poiché i dati non strutturati non seguono un formato predefinito, la loro archiviazione può rappresentare un’ulteriore sfida per le aziende. Un file video occupa molto più spazio di un breve documento di testo, e gestire l’organizzazione di una tale varietà di dati non è per forza banale. Nella realtà, molti team IT non ne tengono traccia, ma spesso potrebbero rappresentare dei rischi o falle di sicurezza sconosciuti all’azienda, trasformando i dati non gestiti in un problema nello storage cloud e data center.
Inoltre, le organizzazioni devono fare i conti con i cosiddetti “dark pool” di dati, ovvero informazioni che vengono create in un determinato sistema o storage, ma che possono poi essere spostate in altri sistemi a disposizione di utenti e macchine, anche in modo automatico. Questo crea nuove sfide e rischi, poiché i dati vengono separati dal luogo in cui sono stati originariamente creati, facendone perdere il controllo, con tutti i rischi che ne conseguono a livello di visibilità e gestione.
Analizziamo i pro e i contro dell’archiviazione dei dati non strutturati sia on-premises che nel cloud.
On-Premises
La capacità di proteggere i dati è senza dubbio il più grande vantaggio dell’archiviazione on-premises. Essendo archiviati fisicamente in azienda, i dati sensibili non devono uscire dal perimetro di sicurezza, i dipendenti possono accedervi più facilmente, anche in caso di problemi con Internet, e i cybercriminali incontrano maggiori difficoltà nel colpirli e violarli rispetto a quelli archiviati nel cloud.
Tuttavia, quando i dati sono archiviati on-premises, è responsabilità del team IT gestirli e proteggerli. Questo include il backup di tutti i dati, che può essere una sfida complessa se non si dispone di una soluzione esterna di gestione dei dati che si occupi del lavoro pesante.
I data center on-premises costruiti nel corso di anni, o persino decenni fa, vengono ora estesi alle infrastrutture cloud. Questo significa aggiungere maggiore complessità e ulteriori sfide in termini di dispersione dei dati. È pressoché indiscutibile il valore aggiunto che applicazioni e workload cloud apportano all’azienda, ma ormai non è più una questione di scelta. Le imprese sono determinate a spostare i workload nel cloud e questo contribuisce a creare il Business Integrity Gap. Questo divario è la differenza tra la situazione in cui si trovano le aziende prima di passare al cloud e quella che affrontano per raggiungere gli obiettivi di trasformazione digitale.
Utilizzo di cloud storage
Il cloud è stato indubbiamente una salvezza per le aziende durante la pandemia, in quanto ha permesso a molti dipendenti di lavorare fuori dall’ufficio. Tuttavia, questo ha significato che gli utenti sono stati messi in grado di accedere ai dati senza per forza rispettare le misure di sicurezza aziendali, rendendo più complesso proteggerli rispetto al passato.
Non è un caso che per i CIO oggi, passaggio al cloud e riduzione dei rischi connessi rappresentino priorità assolute. Con l’evoluzione dell’IT, quando si aggiungono tecnologie per soddisfare nuove richieste ed esigenze, i dati possono trovarsi anche in ambienti multipli, tra cui il multi-cloud e storage remoto distribuito. Ciò comporta ulteriori rischi e potenziali perdite di informazioni dovute alla frammentazione e alla mancanza di gestione dei dati non strutturati.
Essendo così tanti, e molti di essi necessari per un ottimale funzionamento dell’azienda, il cloud risulta essere una buona opzione di archiviazione. Le soluzioni SaaS consentono di utilizzare solo ciò che serve, quando necessario, ma è fondamentale ricordare che i provider sono responsabili solo dell’accessibilità dei dati, non del loro ripristino – non è un aspetto negativo del cloud, ma un elemento che le aziende devono tenere in considerazione.
Con l’adozione del cloud, e il conseguente incremento della superficie aziendale, si assiste anche a un aumento dei cyberattacchi, che colpiscono organizzazioni e governi. Questo estende il numero sfide da affrontare, in quanto le imprese devono monitorare sicurezza, accesso e controlli dei dati in tutto l’ambiente digitale per evitare l’incremento del numero di attacchi ransomware, fughe di dati, violazioni o accessi non autorizzati.
Sistema ibrido
La scelta di uno storage ibrido è un’opzione molto popolare per le aziende che passano da un ambiente on-premises al cloud. Il cloud è agile, flessibile e scalabile ed è importante che i data store tradizionali on-prem possano allinearsi con successo a questi benefici.
I dati non sono mai stati così preziosi, ma sono anche vulnerabili a causa del loro elevato valore. Per questo è necessario colmare il Business Integrity Gap descritto sopra con una piattaforma che consenta alle imprese di accelerare la crescita, fornendo flessibilità, libertà di scelta e funzionalità integrate per risolvere le sfide che si incontrano in questa espansione verso ambienti ibridi, eterogenei e multi-cloud.
È importante garantire un’esperienza unificata per soddisfare le esigenze aziendali dei clienti sia in locale che nel cloud, includendo gestione e protezione, conformità e governance, trasformazione e insight sui dati, senza compromettere l’architettura del cliente. In questo modo si potrà scegliere quando, come e quali dati spostare nel cloud, capire dove risiedano e quali policy applicare, riducendo così rischi e costi.