Cloudera, fornitore globale della piattaforma di analisi e gestione dei dati basata su Apache Hadoop e di tecnologie open source, ha pubblicato i risultati di un benchmark che ratifica come il moderno database analitico di Cloudera, alimentato da Apache Impala (in fase di progettazione), offra funzionalità per i carichi di lavoro cloud nativi in modo più conveniente rispetto a soluzioni alternative. Impala offre massima scalabilità, una miglior flessibilità e la possibilità di lanciare query Amazon S3 dirette, funzione non disponibile con i sistemi ad architettura tradizionale come Redshift. Grazie a un design moderno, Impala disaccoppia i dati dall’elaborazione per fornire le stesse analisi SQL ad alte prestazioni sia in modalità cloud nativa sui dati in S3 sia attraverso un’ampia gamma di alternative di storage on-premise e cloud. Inoltre, Impala abilita tutte queste funzionalità e fornisce prestazioni decuplicate e più convenienti del 275% rispetto a Redshift, il database analitico di Amazon, il che equivale a maggior valore, tutto all’interno di una piattaforma aperta.
Utilizzando le query del benchmark standard TPC-DS, Cloudera ha messo a confronto Impala nel cloud (sia in modalità cloud nativa su S3 che su storage EBS locale) con Amazon Redshift (in grado di operare solo su storage proprietario su istanze AWS dedicate). I risultati del benchmark mostrano quanto segue:
- Impala ha un costo inferiore del 200% ed è 10 volte più veloce su S3 rispetto a Redshift in modalità general purpose
- Impala è l’8% meno costoso e più veloce del 90% su S3 rispetto a Redshift pre-impostato per query specifiche di reporting fisse
- Impala è anche meno costoso del 28-275% e più rapido del 42-400% su EBS rispetto a Redshift in modalità pre-impostata o general purpose.
“I nostri clienti cercano sempre più di spostare i carichi di lavoro BI e di analisi in ambienti cloud per sfruttare la convenienza offerta dalla scalabilità e da una maggiore flessibilità. Ma continuano a richiedere le analisi ad alte prestazioni e l’agilità dei big data cui sono abituati in modalità on-premise,” spiega Charles Zedlewski, Vice President, Products, di Cloudera. “Impala porta nel cloud tutti i vantaggi che offre rispetto ai database analitici tradizionali con un’architettura moderna che abilita un’agilità sempre precedenti indipendentemente da dove risiedono i dati. Questo confronto è la prova evidente che Impala non ha pari per questi carichi di lavoro BI e di analisi nel cloud”.
Poiché le aziende desiderano acquisire più dati da nuove fonti, adattare attivamente i modelli basati su esigenze mutevoli e progettare in modalità iterativa per numerosi casi d’uso, hanno necessità di un database analitico moderno che sia costruito per gestire tali requisiti, senza ostacolare la produttività dell’azienda. Il design rigido e la portata poco flessibile dei sistemi monolitici progettati in modo tradizionale, on-premise o nel cloud, non consentono di rispondere correttamente alle esigenze di business odierne in costante evoluzione. Il database analitico di Cloudera, alimentato da Impala come engine SQL interattivo, è creato appositamente per portare analisi SQL ad elevate prestazioni nei big data, con la scalabilità flessibile per le distribuzioni in cloud e on-premise, come e quando necessario.
Impala opera nativamente con i dati archiviati su diversi engine di storage, tra cui l’object store Amazon S3, eliminando la necessità di spostare o caricare i dati su cluster Impala. Specialmente per le distribuzioni cloud, ciò si traduce in risparmi di costi ed efficienze dal momento che i cluster transitori possono essere accelerati come richiesto per i carichi di lavoro BI e reporting e, grazie alla conveniente archiviazione offerta da S3, una maggior quantità di dati è più velocemente disponibile per l’analisi.
Una costante area di focalizzazione per Cloudera è il miglioramento di prestazioni, scalabilità e concorrenza di Impala. L’azienda ha ampliato il divario prestazionale tra l’architettura del database analitico di Impala e altre alternative per i carichi di lavoro mono e multi utente. L’ultima release offre prestazioni 12 volte migliori per i carichi di lavoro sicuri rispetto alle sue due versioni precedenti. Cloudera prevede di continuare ad ampliare i benefici di Impala in termini di valore e prezzo/prestazioni aggiungendo il supporto in futuro per altri object store nel cloud pubblico.