[section_title title=Big Data: la visione di Cloudera – Parte 1]
Con l’irrompere dei Big Data sul panorama internazionale le cose sono cambiate e stanno cambiando sempre di più con il passaggio dalla fase di evangelizzazione a quella di reale e concreta attuazione dei primi progetti. Per questo il data management e gli analytics stanno assumendo un ruolo di primo piano andando a diventare la base su cui le aziende costruiscono un vero e proprio vantaggio competitivo. Abbiamo parlato di questo con Michele Guglielmo, Regional Sales Director di Cloudera per l’Italia ed il Sud Europa, in carica da febbraio 2016.
I Big Data possono rappresentare una reale opportunità di business. Come sfruttarli per incrementare davvero la produttività e creare un vero vantaggio competitivo?
Cloudera, basandosi sulla sua esperienza maturata negli otto anni dalla fondazione, ha individuato quattro driver che guidano un progetto Big Data.
Il primo è la modernizzazione dell’architettura data warehouse classica che dovrebbe portare ad un abbattimento dei costi. Col crescere esponenziale del numero dei dati, strutturati e non strutturati, infatti le aziende devono effettuare degli investimenti molto forti per mantenerli in data warehouse classico, ma contemporaneamente nascono nuove esigenze di flessibilità e di velocità nell’elaborazione del dato. La nuova visione dell’architettura del data warehousing fa sì che attraverso l’uso di nuove fonti dati e l’innovazione e la velocità di elaborazione del dato stesso sia possibile appunto ridurre il costo rispetto al modello precedente.
Il secondo driver invece?
E’ relativo al business, ovvero la possibilità di sviluppare una conoscenza approfondita della clientela utilizzando dati provenienti da canali di accesso diversi e da comunicazioni diverse a disposizione dell’azienda. Il fatto che le informazioni relative ai clienti siano raccolte tramite diversi strumenti comporta allo stato attuale un loro trattamento come silos separati. Occorre invece mettere le aziende in una condizione tale da poterli mettere a fattor comune e correlarli in maniera adeguata, così da produrre una serie di informazioni che aiutano l’azienda ad essere più competitiva e a fidelizzare il cliente tramite un’analisi in real time di quelle che sono le tendenze.
Un esempio calzante è quello del retail dove il coordinamento tra le informazioni prodotte dall’ERP aziendale relative alla disponibilità a magazzino e la wish list dei clienti compilata sul sito internet può far capire se è il caso oppure no di fare una promozione, annullando o comunque riducendo notevolmente il rischio di perdere soldi. I Big Data permettono quindi una gestione più precisa e puntuale che dà vantaggi sia al cliente che all’azienda stessa. E proprio qui sta il terzo driver: nel miglioramento dei prodotti e dell’efficacia dei servizi offerti alla clientela per dare velocità su quello che è l’impatto diretto col cliente.
Il quarto punto?
Riguarda la sicurezza e la compliance, cioè la capacità di mitigare il rischio di frode e di truffe o di essere rispondenti alle nuove regolamentazioni politiche e alle compliance sempre più stringenti.
Si tratta di un tema molto caldo soprattutto perché le compliance sono un progetto never ending: cambiano nel tempo ed è necessario dotarsi degli strumenti più adeguati e flessibili per essere sempre rispondenti.
I vantaggi, quindi, ci sono tutti. Ma le aziende se ne rendono effettivamente conto? Come percepiscono davvero i Big Data? Si stanno attrezzando e in che termini?
Le aziende stanno guardando ai Big Data come ad un vantaggio competitivo vero e proprio. Le prime ad attrezzarsi sono ovviamente le banche perché il tipo di vantaggio che ne derivano calza a pennello sulle loro esigenze. Ma non solo loro stanno investendo in maniera massiva. Anche il mondo del manufacturing e dei trasporti sta rispondendo in maniera positiva.
Le aziende quindi hanno ben chiaro il tipo di vantaggio che possono derivare dall’adozione di un progetto Big Data, ma occorre essere molto concreti.
In che senso?
In passato è capitato che ci si facesse prendere un po’ la mano dall’entusiasmo e dalla fantasia. Per ottenere dei risultati in maniera immediata non si è capito che il progetto Big Data è particolarmente complesso e che richiede soprattutto il coinvolgimento di tutti i dipartimenti e le funzioni aziendali. Tutti questi processi infatti vanno a toccare il business, l’It, la security, le HR e non si può pensare di dare avvio ad un progetto senza coinvolgere le varie funzioni. Occorre quindi andare a gestire la relazione con le varie funzioni aziendali per avere un risultato immediato e veloce che dimostri la bontà del progetto.
E la complessità del progetto Big Data si esaurisce in questo?
Bisogna tenere presenti anche le difficoltà tecniche perché devono esserci una serie di elementi che aiutino ad elaborare il dato, non ultimo il discorso di avere l’allineamento classico processo, persone e tool. Questi tre elementi devono essere allineati, pena il rischio di fallimento del progetto.
Sul panorama Big Data, se vogliamo vedere l’ecosistema Hadoop, mentre fino a qualche anno fa avevamo cinque o sei progetti, oggi ne abbiamo raggiunti più di una ventina. Abbiamo una serie di applicazioni che insistono su Hadoop e che consentono di avere risultati completamente diversi. Si pensi ad esempio a Spark: nuove tecnologie e applicazioni che consentono di avere una visibilità sul dato completamente diversa rispetto a quella che avevamo qualche anno fa.
A proposito di Hadoop: Apache Hadoop compie 10 anni. E’ ancora attuale oggi il ruolo del software libero in questo scenario?
Assolutamente sì. La base di lavoro è proprio quella dell’Open Source. La nostra soluzione principe, Cloudera Enterprise, si basa infatti su Hadoop. Cloudera è un’azienda che vende delle sottoscrizioni perché abbiamo capito che dal punto di vista enterprise ci sono esigenze specifiche rispondenti a tematiche di security, di compliance, e soprattutto di governo della struttura software. Noi garantiamo al cliente una serie di servizi a supporto mediante la sottoscrizione di licenze che prevedono non solo la parte open source ma anche una parte di software proprietario, che sono i tool Cloudera Navigator – dedicato a mondo security ed encryption del dato – piuttosto che Cloudera Manager e Cloudera Director, che consentono di gestire un ambiente complesso di Big Data Hadoop.
Quindi la base di lavoro è importante che rimanga open source, dove noi investiamo tantissimo (siamo l’azienda con il maggior numero di committers sul mondo open source). Poi ogni azienda potrà valutare se andare su una soluzione open source supportata piuttosto che rimanere open source, ma questa è una scelta dell’utente.
Prosegui la lettura alla pagina seguente