Ormai non è più un segreto: molte aziende trovano difficoltoso abbandonare i sistemi legacy IT tradizionali a favore di architetture di dati più moderne. Ma come ogni relazione complicata che si rispetti, la sfida più grande è proprio quella di conquistare la fiducia necessaria per intraprendere la separazione.
Per tutte le aziende italiane che necessitano di una spinta in più o di una motivazione definitiva per abbandonare i propri sistemi di legacy come Apache Hadoop, Toby Balfre, VP Field Engineering EMEA di Databricks, spiega da dove iniziare.
I sistemi tradizionali possono rivelarsi complessi da gestire ed essere molto costosi, perché richiedono un’elevata concentrazione di risorse e sono molto onerosi da manutenere. A fronte della crescita esponenziale dei dati in molte aziende e della conseguente necessità di condurre analisi più avanzate come il machine learning (ML) e l’intelligenza artificiale (AI), i progetti di advanced analytics distribuiti su software obsoleti come Hadoop, sono destinati a scomparire.
Nel confrontarsi con le opinioni di molti CIO, è evidente che le carenze di Hadoop sono riconosciute e comprese. Secondo uno studio globale condotto da Databricks e dal MIT e frutto di interviste con Chief Data Officer, Chief Analytics Officer e Chief Information Officer, ben il 50% ha dichiarato di essere attualmente impegnato nella valutazione o nell’implementazione di una nuova piattaforma di dati per affrontare le sfide attuali.
Al passo con il cloud
Un problema comune consiste nel definire quali sono le architetture di dati alternative disponibili e le modalità con cui i CIO possono compiere la migrazione nel modo più semplice possibile. Muovere i primi passi nell’on-premise può risultare un compito scoraggiante e se una nuova migrazione viene reputata non fruttuosa o eccessivamente lenta, le conseguenze potrebbero essere molto onerose.
Il futuro si muove nella direzione di architetture dati e intelligenza artificiale altamente scalabili e semplici da amministrare; in questo modo sarà possibile per i data team concentrarsi sulla creazione di casi d’uso e non sulla gestione dell’infrastruttura che, al contempo, dovrebbe fornire una soluzione affidabile per gestire qualsiasi tipo di dato, abilitando casi d’uso e analytics in tempo reale.
La soluzione è rappresentata dalle piattaforme lakehouse, le quali forniscono un livello transazionale strutturato a un datalake per ottimizzare prestazioni, affidabilità, qualità e scalabilità in modalità analoghe a quelle di un data warehouse, permettendo di realizzare molti dei casi d’uso che tradizionalmente avrebbero richiesto data warehouse legacy con il solo datalake.
La migrazione a una piattaforma lakehouse sembrerebbe l’ideale, ma molti CIO si chiederanno quanto sia facile arrivare a questo punto. Vediamo quindi alcuni dei semplici passi da compiere nella migrazione dai sistemi legacy.
1.Confrontarsi
Le organizzazioni che desiderano intraprendere una migrazione di successo dovrebbero organizzare audit interni per comprendere perché l’azienda vuole migrare, chi sarà necessario coinvolgere e come la migrazione si inserisce in una strategia cloud globale.
Per realizzare una migrazione di successo, i team che si occupano dei dati, i CIO e CDO sono chiamati a confrontarsi in modo continuativo. Alcune domande logiche da cui partire sono: “A che punto siamo ora?” e “Dove dovremmo essere?”. Questa fase iniziale di sperimentazioni e creazione di nuove conoscenze, consentirà ai team di valutare lo stato dell’infrastruttura attuale e pianificare la nuova.
2. Eseguire una valutazione della migrazione
Qualsiasi progetto di migrazione non sarà un successo immediato. L’approccio più realistico per molti sarà quello di migrare progetto per progetto: le aziende dovranno individuare i progetti in esecuzione e, in molti scenari, dovranno anche costruire un business case per qualsiasi migrazione, calcolando, ad esempio, il costo di una nuova piattaforma lakehouse.
3. Definire correttamente gli elementi tecnic
Nella fase più operativa e “tecnica”, le aziende devono analizzare l’architettura di destinazione e assicurarsi che sia in grado di supportare le esigenze aziendali a lungo termine. In genere, questo processo comporta la mappatura di tecnologie precedenti o la loro ottimizzazione. Similmente, le organizzazioni sono chiamate a valutare come migrare dati e carichi di lavoro nel cloud e infine dovranno condurre valutazioni, demo e production pilot per l’adozione di una nuova architettura di dati.
4. La fase finale: esecuzione della migrazione
L’ultimo aspetto da considerare è la fase di esecuzione vera e propria. La migrazione non è semplice, tuttavia una buona esecuzione è essenziale per la rapidità con cui l’organizzazione può iniziare a scalare le proprie pratiche di analytics, riducendo i costi e migliorando la produttività dei data team. Per garantire continuità, le aziende dovrebbero prendere in considerazione l’esecuzione dei carichi di lavoro sia sul sistema precedente che sulla nuova architettura dati, assicurandosi che tutto sia perfettamente uniforme. Con il tempo, si potrà optare per una migrazione totale a una nuova architettura dati e dismettere quindi il caso d’uso dalla struttura precedente. Poiché le organizzazioni invitano i propri team a fare maggior uso e beneficiare delle potenzialità di dati e intelligenza artificiale, è arrivato il momento per le aziende italiane di non limitarsi solo a considerare l’adozione di una nuova architettura dati, ma abbiano la consapevolezza di poter finalmente fare questo passo e agire: quanto più a lungo le organizzazioni aspetteranno a compiere questa mossa, tanto più dolorosa sarà la sensazione di non riuscire a tenere il passo con le crescenti aspettative dei clienti e le pressioni della concorrenza.