Oggi per le aziende non è più tanto fondamentale disporre di quantità sempre più grandi di dati quanto avere la possibilità e la capacità di mettere questi dati a fattor comune ed utilizzarli per estrarne l’effettivo valore. I dati vanno processati in modo efficace, rapido e scalabile affinché creino valore per l’azienda. Diventare un’azienda data-driven, quindi capace di estrarre valore dai dati, è però un processo complesso, che coinvolge non solo l’adozione della giusta tecnologia ma anche un salto a livello culturale: motivo per cui occorre affidarsi al giusto partner. Roberto Coluccio, Data Architect di Agile Lab, azienda italiana specializzata in Data Engineering, ci ha spiegato come sta evolvendo lo scenario della Data Engineering e come Agile Lab va a raccogliere le reali esigenze delle imprese affiancando ad un approccio più tradizionale di Data Lake e Data Warehouse, una strategia innovativa basata sul Data Mesh, che mette realmente il dato al centro dei processi aziendali, indipendentemente dalla sua tipologia, collocazione o piattaforma di riferimento. Con questo tipo di approccio a diventare scalabile non sono tanto e solo gli applicativi, ma l’intera organizzazione, migliorando così il time-to-market delle iniziative dati, riducendo lo stress, la pressione e le inefficienze del team centrale di data engineering, favorendo il consumo ‘affidabile’ dei dati da parte dei consumatori.
“Agile Lab, azienda italiana fondata nel 2014, è specializzata nello sviluppo di soluzioni e piattaforme in ambito Data Engineering e sistemi data-intensive, puntando su tecnologie innovative e servizi abilitanti per fornire un vantaggio competitivo concreto, creando efficienza e ottimizzando tutti i processi aziendali ad alta intensità di dati – esordisce Coluccio – . Ci rivolgiamo principalmente ad aziende enterprise, attive nel mercato italiano ed europeo, che fanno (o mirano a fare) dei dati il combustibile per i motori decisionali a supporto delle iniziative di business. In questi contesti, è necessario dover gestire grandi volumi e varietà di dati, processarli in modo efficace, rapido, scalabile e servirli nel modo opportuno in modo tale che il loro consumo e governance portino effettivamente alla creazione di valore in azienda: in tal senso, oltre che alle attività di design e sviluppo, supportiamo i nostri clienti anche nella definizione e implementazione della loro data strategy”.
Qual è il vostro obiettivo?
“Il nostro obiettivo è creare una cultura guidata dai dati, snellire e accelerare le attività, estrapolando il valore insito in essi e mettendolo a disposizione della stessa organizzazione. Il nostro approccio innovativo, abbinato a una profonda conoscenza delle più avanzate metodologie e tecnologie, ci consente di supportare i clienti con soluzioni ritagliate sulle loro reali esigenze, garantendo loro scalabilità, prestazioni e massima flessibilità, anche in ottica di evoluzione e gestione costi sul medio-lungo periodo.
Sono molte le aziende con le quali operiamo, nei più svariati settori, tra cui servizi finanziari e assicurativi, utility e telecomunicazioni e servizi specifici dedicati all’ambito Internet of Things nel manifatturiero e nel mondo dei trasporti e della logistica”.
Come abbiamo visto, Agile Lab nasce per fare data engineering e in questa materia negli ultimi anni si è assistito a una vera e propria esplosione nel numero dei dati che hanno a disposizione le aziende. Qual è la reale situazione e come sono cambiate le esigenze delle aziende che vogliono diventare data-driven?
“L’evoluzione digitale che abbiamo vissuto in questi ultimi anni ha aumentato in modo sensibile la quantità di dati che viene prodotta ogni giorno dalle aziende, e che può e deve essere gestita in modo da poter rispondere in modo adeguato alle necessità di mercati sempre più dinamici. Saper gestire questi dati non è una semplice abilità tecnologica, bensì un’arte che richiede metodo, standard, conoscenze, esperienza e strategie che possono riguardare ogni livello di un’organizzazione. Diventare un’azienda data-driven è un percorso che coinvolge aspetti tecnici, organizzativi sociali e di processo, e che richiede la partecipazione e collaborazione di numerosi attori. Si tratta di un cambiamento culturale in prima battuta, cui solo successivamente si accompagna l’evoluzione di piattaforme e infrastrutture a supporto”.
Perché oggi essere data-driven è fondamentale per essere competitivi?
“Ogni mercato ha vissuto una profonda trasformazione nel corso degli ultimi anni. La crescente digitalizzazione ha ridisegnato equilibri che sembravano consolidati, aprendo prospettive importanti per attori nuovi, capaci di rispondere in modo adeguato a richieste dei clienti sempre più dinamiche. Oggi più che mai è fondamentale identificare in modo tempestivo, quando non anticipare, le tendenze del mercato per creare un proprio vantaggio competitivo. In quest’ottica, raccogliere dati in tempo reale è certo fondamentale, ma non è sufficiente a creare valore. Le aziende si stanno rendendo conto che non è necessariamente la quantità a portare valore, ma piuttosto il valore nasce dalla capacità di analizzare e comprendere i dati che si hanno a disposizione – pensiamo ad esempio alla valutazione del comportamento degli utenti, all’andamento del business, proporre servizi personalizzati, manutenzione predittiva, previsioni sul futuro. Una ricerca di Forrester ha dimostrato che le organizzazioni che dispongono di un sistema di insight data-driven hanno il 140% di probabilità in più di creare un vantaggio competitivo sostenibile e il 78% di probabilità in più di aumentare il fatturato. In precedenza, è passato molto – forse troppo – il concetto di “data is the new oil”, ma non dimentichiamoci che, tanto quanto il greggio, da sola la quantità di materia grezza non è si per sé un valore se non accuratamente processata e distribuita a chi (e come) la può/desidera consumare”.
In risposta a questo tipo di scenario Agile Lab lavora anche sul nuovo paradigma del data mesh, alternativo ai modelli Data Lake e Data Warehouse, per semplificare la transizione vero una cultura data-driven. Di cosa si tratta?
“Negli ultimi anni, la tendenza principale nella gestione dei dati è stata quella di centralizzarli – assieme alle relative competenze tecniche per elaborarli e gestirli, sia a livello fisico – con i modelli Data Lake e Data Warehouse – che tecnico/organizzativo (team centrale IT/Data Engineering). Il panorama tecnologico globale ha supportato queste strategie proponendo, anno dopo anno, sistemi e piattaforme per l’elaborazione dati sempre più efficienti e meno costosi grazie anche alla diffusione dei servizi cloud. Tuttavia, in particolare in contesti enterprise dove la complessità tecnica è pareggiata, se non superata, da quella organizzativa di persone, sistemi, dipendenze, gestione budget e progetti, questi approcci hanno evidenziato importanti limiti di scalabilità generando scarsi ritorni di investimento sulle piattaforme di elaborazione dati, frustrazione nei team centrali divenuti colli di bottiglia della catena del valore e mancanza di fiducia e garanzie di allineamento a standard di qualità e compliance da parte dei potenziali consumatori. In quest’ottica è emerso un nuovo paradigma, il Data Mesh, basato su un’architettura (tecnica ed organizzativa) distribuita e decentralizzata, progettata per aiutare le imprese ad acquisire agilità e scalabilità e che riconosce l’importanza di un approccio distribuito, in termini di ownership, e domain-driven – per quanto riguarda l’organizzazione dei dati e del loro ciclo di vita – unito a uno federato per la relativa governance che per indirizzare le necessità di scalabilità deve, necessariamente, diventare “computazionale”, ovvero dominata da automatismi. I domini, resi autonomi, sono così liberi di innovare, grazie anche al supporto di piattaforme abilitanti pratiche di self-serve infrastrutturale, pur restando responsabili di offrire al mercato interno dei consumatori dei prodotti (dati, si parla infatti di “data products”) di qualità certificata”.
Che problemi va a risolvere il Data Mesh rispetto agli approcci tradizionali?
“Il Data Mesh consente appunto di pensare ai dati come prodotti offerti e gestiti da specifici domini, andando così incontro ai reali requisiti di business di un’impresa, più che alle singole esigenze applicative, sicuri che gli standard definiti a livello di governance federata siano rispettati in quanto resi “built-in” in una piattaforma a supporto delle business unit, che consenta la creazione guidata di “data products” uniti all’approvvigionamento in modalità “self-service” di risorse infrastrutturali (compute, storage, etc.). Questo approccio mette realmente il dato al centro dei processi aziendali, indipendentemente dalla sua tipologia, collocazione o piattaforma di riferimento. Ciò che diventa scalabile è l’organizzazione, ancor più che gli applicativi, migliorando così il time-to-market delle iniziative dati, riducendo lo stress, la pressione e le inefficienze del team centrale di data engineering, favorendo il consumo “affidabile” (ovvero con fiducia) dei dati da parte di consumatori che saranno così più invogliati a investire sui dati stessi, poiché da questi sarà più semplice per loro generare valore. Inoltre, i domini avranno autonomia di innovare ed evolversi senza essere necessariamente legati a una unica tecnologia centrale (pensiamo al modello Data Warehouse)”.
Quali sono i vantaggi per le aziende che decidono di abbracciare questo tipo di architettura?
“L’aspetto rivoluzionario del Data Mesh consiste nel non limitarsi alla semplice tecnologia quando si parla di Data Engineering. Troppi data engineer si concentrano su strumenti e framework, ma in realtà sono le pratiche, i concetti e i modelli a contare anche di più: le tecnologie sono destinate a diventare obsolete, mentre le buone pratiche organizzative, metodologiche e ingegneristiche possono durare ben più a lungo.
Il Data Mesh è un paradigma che affronta proprio questo argomento, svincolandosi dalle tecnologie sottostanti ma permettendo di ottenere la massima scalabilità e flessibilità, in termini di opportunità di innovazione, di time to market e di tradurre i dati in informazioni e insight di valore per l’azienda e la sua strategia. Permette di incrementare il livello di interoperabilità, di collaborazione e condivisione dei dati, agevolando relazioni e attività agili e fluide tra team, eliminando ogni eventuale collo di bottiglia”.
Come è cresciuto e come sta crescendo l’approccio Data Mesh in termini di adozione?
“Come detto, il Data Mesh è un paradigma che prevede un cambiamento organizzativo e culturale che coinvolge i processi e, soprattutto, le persone. Le grandi aziende con una strategia data-driven in atto stanno iniziando a capire che gli approcci Data Lake e Data Warehouse pongono dei limiti che il Data Mesh può senza dubbio aiutare a risolvere. Questo vantaggio è particolarmente evidente nelle strutture più articolate, che abbinano una produzione di dati elevata con architetture, organizzative e tecnologiche, altrettanto complesse. Se il mercato italiano è stato un po’ più lento a comprenderne i benefici, il cambiamento culturale è ora in atto anche da noi e nei prossimi dieci anni questo paradigma rappresenterà il futuro”.
In concreto un’azienda che strategia dovrebbe adottare per implementare con successo un approccio Data Mesh?
“Il primo shift da attuare è quello di rendere i team di sviluppo indipendenti nello sviluppo di iniziative dati, facilitando e velocizzando l’applicazione di principi e best practice grazie all’ausilio di una piattaforma abilitante il self-service infrastrutturale e l’automazione delle policy di governance dei dati. A questo stadio si raggiunge una discreta autonomia e compliance ma, più importante, si avvia un processo di diffusione culturale dei concetti di governance, self-service, template, senza attribuire dall’oggi al domani l’ownership dei dati analitici ai domini che, fino a ieri, conoscevano e gestivano solamente il perimetro cosiddetto “operazionale”, ovvero il mondo di servizi, applicazioni e sistemi che si interfacciano con i clienti delle aziende. In una fase successiva, si può spingere sull’ownership decentralizzata e guidata dai domini ai quali, grazie alla ormai consolidata definizione di standard di qualità e interoperabilità, si può chiedere di gestire e offrire al mercato interno (ed esterno) dei consumatori dei “data products” di qualità.
Se è vero che la scalabilità organizzativa prima ancora che tecnologica è l’obiettivo cardine del Data Mesh, allora è evidente come il paradigma indirizzi più di tutte le aziende di media-grande dimensione (in termine di unità di business, processi, persone, servizi, iniziative). Non per questo i fondamenti e le best practice del Data Mesh non si applicano anche a realtà meno complesse, anzi: partire da greenfield per quanto riguarda la data culture sicuramente consente ancora più agilmente l’introduzione (magari semplificata) di questi principi”.
Ci sono già dei casi reali dove trova applicazione quanto ci ha raccontato?
“Un caso di successo rilevante per Agile Lab è quello di un’azienda leader mondiale nella fornitura di soluzioni di trasporto, tra cui autocarri e autobus, per applicazioni di trasporto pesante combinate con un’ampia offerta di servizi legati al prodotto. L’azienda offre anche servizi di finanziamento, assicurazione e noleggio dei veicoli per consentire ai clienti di concentrarsi sul loro core business ed è inoltre uno dei leader nella produzione di motori industriali e marini. L’azienda ha da sempre una cultura consolidata del valore dei dati che offre ai propri clienti e a questo proposito ha deciso di adottare il paradigma Data Mesh per ottimizzare la propria proposta e riuscire così anche a colmare le lacune create da approcci Data Lake e Data Warehouse. E supporta i propri clienti a ottenere valore, affidandosi a servizi intelligenti forniti tramite la piattaforma Data Mesh Boost di Agile Lab che abilita il self-service di infrastruttura e permette di velocizzare l’implementazione di iniziative dati di qualità certificata che, in questo caso specifico, puntano all’estrapolazione di informazioni a valore aggiunto che consentano di informare il cliente su ogni tipologia di attività di manutenzione predittiva – ad esempio il cambio di un componente di un autocarro – ottimizzando i processi e incrementando efficacia e produttività”.
La piattaforma di Agile Lab come supporta e abilita il percorso verso il data mesh?
“La nostra piattaforma è pensata per gli sviluppatori, è completamente personalizzabile in base alle esigenze e agli standard dei clienti e permette di sviluppare template, servizi di provisioning infrastrutturale modulare e integrazione di tecnologie (potenzialmente, qualsiasi la governance reputi auspicabili), ottimizzando interoperabilità e scalabilità di processo, garantendo massima flessibilità in termini di scelta tecnologica, operatività e interazione grazie ad un data marketplace integrato, e riducendo la complessità che i team si trovano a dover affrontare nel mettere a terra soluzioni dati.
La piattaforma consente infatti un’esperienza di sviluppo semplificata, fornendo funzionalità pronte all’uso per sviluppare e distribuire data products di qualità e conformi da subito grazie alla possibilità di implementare automatismi interni che realizzano le policy e gli standard decisi dalla governance, limitando così i cicli di rework, il tutto con significativi vantaggi in termini di tempi di sviluppo ma anche di qualità del prodotto finale”.
Per finire: come prevedete che evolverà l’adozione di questo approccio e quali sono gli obiettivi di Agile Lab nel medio-breve termine?
“Le grandi aziende italiane sono sempre più consapevoli dell’importanza di questo nuovo paradigma per ottimizzare la pratica di gestione dei propri dati, e sempre più spesso siamo coinvolti con loro per supportare la definizione di strategie data-driven efficienti e a prova di futuro. Come già sottolineato, non è solo un cambiamento tecnologico, ma culturale, che richiederà impegno e una rivoluzione dell’approccio ai dati e alla loro gestione. In questo senso, la sensibilizzazione e la formazione all’utilizzo dei dati in azienda e al riconoscimento del loro valore giocheranno un ruolo fondamentale. Questo per noi di Agile Lab è un aspetto fondamentale, tanto che supportiamo in modo attivo progetti di formazione sul tema, proprio perché riteniamo che dalla consapevolezza sul valore dei dati derivi un approccio innovativo e scalabile alla loro gestione, quale appunto il Data Mesh”.