Kudu, il nuovo sistema di storage basato su colonne (columnar store) per Hadoop che abilita una potente combinazione di rapide analitiche per i fast data, è disponibile in versione Beta. L’ enginee di storage nativo Hadoop supporta sia accesso casuale a bassa latenza e analitiche con throughput elevato, semplificando notevolmente le architetture Hadoop per casi d’uso real-time sempre più comuni. Una versione Beta pubblica di Kudu è già disponibile in base alla licenza open source di Apache e in futuro verrà trasferita nell’incubatore Apache Software Foundation.
L’architettura di Kudu ottimizza l’esperienza dello sviluppatore nella creazione di applicazioni analitiche, supportando casi d’uso comune che includono l’analisi delle serie temporali, le analitiche dei dati macchina e la reportistica online. Inoltre, Kudu è progettato per sfruttare i mutevoli trend in ambito hardware ed elaborazione in-memory. Offre prestazioni eccellenti della CPU, sfrutta RAM e Flash, e migliora l’efficienza in ambito I/O.. Infine, poiché è un componente aperto nativo all’interno di Hadoop, Kudu è integrato e offre prestazioni più rapide in fase di query per i framework analitici più potenti. Gli utenti fanno già affidamento su molti di questi, tra cui Impala e Spark, per le applicazioni analitiche end-to-end su una singola piattaforma.
Kudu è stato progettato congiuntamente da Cloudera e Intel in anticipo rispetto al mutevole panorama hardware. Intel ha contribuito attivamente a Kudu per fare in modo che sfruttasse appieno le tecnologie di memoria e processore di Intel, attuali e future. Kudu è stato progettato per utilizzare nuove innovazioni di persistent memory (pmem) sviluppate attraverso il progetto pmem di Intel.