ITReview, realtà italiana specializzata in data science e business analysis, ha annunciato una partnership esclusiva con la californiana Trifacta per l’utilizzo dell’omonima piattaforma di “Data Wrangling”, che vanta tra i suoi clienti anche Google.
In questo modo, i clienti di ITReview potranno beneficiare di una soluzione in grado di offrire informazioni immediate e soluzioni di machine learning direttamente sul dato grezzo di ogni fonte, così da esplorare, trasformare e unire dati di qualunque provenienza.
Con il termine data lake, coniato nel 2010 da James Dixon per indicare un “lago” di dati disponibili per l’azienda, affluenti dalle fonti più diverse, anche da IoTe allo stato grezzo, si indica, infatti, la possibilità di raccogliere i dati da un unico “bacino” non gestito dal quale si può, di volta in volta, caricare i dati in modalità grezza per poi successivamente predisporli alle diverse analisi.
Come sottolineato in una nota ufficiale da Andrea De Rossi, CTO e Presidente ITReview: «Abbiamo scelto Trifacta perché consente ai nostri clienti, come banche, aziende della GDO e in generale grandi realtà B2B E B2C, di realizzare coerenti e integrate strategie di marketing, commerciali, di produzione, logistica e quant’altro attraverso uno strumento con cui esplorare visivamente, trasformare, pulire e unire diverse fonti dati, nonché ordinare e comprendere dati aziendali per progetti di larga scala e complessi».
Come funziona Trifacta
Trifacta utilizza un meccanismo denominato “interazione predittiva”, per il quale l’utente non ha bisogno di specificare nel dettaglio la trasformazione dei dati prima di poterli analizzare.
Gli utenti modellano i dati in Trifacta, evidenziano le caratteristiche di interesse nella loro visualizzazione e in base a ciò compiono le proprie selezioni e sviluppano le proprie analisi con i metodi predittivi di Trifacta, che suggeriscono una varietà di possibili passi successivi di trasformazione dei dati, giungendo a comprendere il loro significato intrinseco, per arrivare a formulare una strategia.
Trifacta, grazie al suo Machine Learning, classifica fin da subito, in ordine di più alta probabilità, la trasformazione e manipolazione dei dati che servono all’utente, con i dati che vengono raccolti, comunicando direttamente con Hadoop.
Per accelerare e guidare la pulizia dei dati aziendali, l’integrazione self-service dei dati da più fonti, la piattaforma Trifacta supporta, inoltre, la profilazione automatica dei dati
Inoltre, gli utenti possono compiere numerose azioni di analisi, facendo selezioni, ad esempio, sugli elenchi a discesa, associati a ogni colonna e selezionare la trasformazione di pulizia dei dati appropriata per migliorare il profilo di qualità dei dati. Trifacta può ereditare funzioni di Machine Learning provenienti anche da altri tool, come per la Sentiment Analysis e molte altre ancora.