Teradata ha annunciato il lancio del primo supporto enterprise per contribuire allo sviluppo dell’open source Presto così che un maggior numero di aziende potrà estrarre con maggiore facilità informazioni dei data lake e di sfruttare queste informazioni attraverso l’intero ecosistema analitico.
Sviluppato e utilizzato da Facebook, Presto è un motore SQL open source per query potente e di nuova generazione che supporta i big data analytics.
Presto si integra con il software Teradata QueryGrid e si inserisce perfettamente nella logica della Teradata Unified Data Architecture. Conferisce, inoltre, agli utenti la capacità di originare query direttamente dalla loro piattaforma Hadoop mentre Teradata QueryGrid consente di eseguire query dal Teradata Database e dal Teradata Aster Database attraverso un protocollo SQL comune.
Presto gira su distribuzioni Hadoop multiple. Inoltre, Presto può comunicare da una piattaforma Hadoop per interrogare Cassandra, database relazionali o archivi di dati proprietari. Questa capacità analitica cross-platform consente agli utenti di Presto di estrarre il massimo valore di business da data lake di ogni dimensione, dai gigabyte sino ai petabyte.
Il piano d’azione di Teradata è caratterizzato da tre fasi dove gli interventi della società saranno al 100% open source coperti da licenza Apache e miglioreranno la moderna base di codice di Presto, la scalabilità, la query iterativa e la capacità di eseguire query su multipli archivi di dati.
Nella fase uno si punterà a un miglioramento delle caratteristiche essenziali che semplificano l’adozione di Presto comprese l’installazione, la documentazione a supporto e il monitoraggio di base. Le funzionalità della fase 1 sono già disponibili per il download all’indirizzo Teradata.com/Presto o su Github
L’obiettivo della fase due è l’integrazione di Presto con altre componenti fondamentali dell’ecosistema big data come gli strumenti standard di Hadoop per la gestione della distribuzione, l’interoperabilità con YARN e i connettori che estendono le funzionalità di Presto oltre il file system distribuito di Hadoop (HDFS). Queste funzioni saranno disponibili alla fine del 2015.
Infine nella fase tre si mirerà ad abilitare l’ODBC (Open Database Connectivity) e il JDBC (Java Database Connectivity API) per estendere l’adozione all’interno delle organizzazioni e migliorare l’integrazione con gli strumenti per la business intelligence. Migliorare la sicurezza fornendo un accesso basato su ruoli aziendali. Questi miglioramenti saranno disponibili nel 2016.