Cloudera Altus è una nuova offerta Platform-as-a-Service (PaaS) che semplifica l’esecuzione di applicazioni di elaborazione dati su larga scala nel cloud pubblico. Il servizio Altus iniziale aiuta i data engineer a utilizzare l’infrastruttura on-demand per velocizzare la creazione e l’utilizzo di pipeline di dati flessibili che alimentano le applicazioni orientate ai dati.
Alcune delle principali caratteristiche e i benefici di Altus:
● Servizio gestito di pipeline elastiche di dati – La soluzione PaaS consente ai data engineer di effettuare il provisioning, in modo semplice e veloce, di Apache Spark, Apache Hive, Hive on Spark e MapReduce2 su un’infrastruttura cloud nativa. Altus presenta impostazioni cluster e ambienti intelligenti predefiniti che riducono significativamente i tempi e le attività legati alla distribuzione dei cluster, automatizzando processi come il provisioning, la configurazione e l’eliminazione dei cluster.
● Orientamento del carico di lavoro – Cloudera Altus si concentra sulle pipeline di dati piuttosto che su cluster o infrastrutture, in modo che gli utenti possano presentare, clonare ed effettuare il troubleshooting delle pipeline considerando solo in modo marginale l’infrastruttura alla base.
● Nessun silo di dati – Il servizio Altus Data Engineering permette ai data engineer di leggere e scrivere direttamente sugli storage di oggetti in cloud come fa il resto della piattaforma Cloudera. Questi dati sono immediatamente disponibili per essere utilizzati da altri carichi di lavoro Cloudera senza richiedere replicazione dei dati, ETL o modifiche ai formati di file. Così facendo gli utenti possono inserire con più facilità il data engineering all’interno delle applicazioni di data science, business intelligence e DB real time.
● Retro-compatibilità e portabilità della piattaforma – Altus supporta molteplici versioni di CDH, la piattaforma open source più utilizzata nel settore. Gli utenti possono spostare facilmente i carichi di lavoro da e verso il cloud senza dover modificare le proprie applicazioni. Poiché CDH è retro-compatibile con le minor release, i clienti possono sfruttare le più recenti innovazioni provenienti dalla comunità open source di big data Apache senza paura di disgregare le proprie applicazioni ad ogni release.
● Gestione integrata dei carichi di lavoro – Altus automatizza e semplifica le problematiche operative comuni legate alle pipeline elastiche di dati con la gestione dei carichi di lavoro. Gli utenti possono effettuare il troubleshooting delle attività non andate a buon fine con o senza la presenza di cluster o infrastruttura di calcolo. Inoltre, le funzioni di gestione dei carichi di lavoro di Altus evidenziano variazioni significative nelle prestazioni e propone un’analisi della causa alla base. Così facendo, i clienti possono eseguire le proprie pipeline di dati con una maggior affidabilità e con costi inferiori.
Il rollout iniziale di Cloudera Altus include il supporto per Apache Spark, Apache Hive su MapReduce2, e Hive su Spark. È già disponibile in molte regioni Amazon Web Services (AWS). Più avanti, Cloudera prevede di espandere Altus in modo da supportare altri importanti cloud pubblici come leading public Microsoft Azure, ecc. Per maggiori informazioni o per consultare l’architettura di riferimento, visitare: www.cloudera.com/altus.