Cloudera, the enterprise data cloud company, lancia Cloudera DataFlow per il Public Cloud, un servizio cloud-native per i flussi di dati, che consente di elaborare workload ibridi in streaming sulla Cloudera Data Platform (CDP). Con Cloudera DataFlow per il Public Cloud, gli utenti possono ora automatizzare complesse operazioni di flusso di dati, aumentare l’efficienza operativa dei flussi di dati in streaming con funzionalità di auto-scaling e ridurre i costi del cloud eliminando dubbi e incertezze sul dimensionamento dell’infrastruttura.
Si prevede che i volumi di dati in movimento cresceranno esponenzialmente in tutti i settori, fino a raggiungere 79 ZB, secondo il Worldwide Global DataSphere IoT Device and Data Forecast di IDC, 2021-2025, e molte organizzazioni già sfruttano Apache NiFi per catturare ed elaborare i dati attraverso architetture cloud ibride, progettando visivamente flussi di dati senza codice. Mentre il cloud fornisce un facile sbocco per l’elaborazione o l’archiviazione di grandi volumi, sono molte e diverse le sfide che restano da affrontare. L’implementazione di decine di sofisticati flussi di dati in un singolo cluster può portare a sfide legate a operatività e monitoraggio. Se più flussi NiFi si contendono le stesse risorse, questo può portare a problemi di performance. Gli amministratori IT spesso scelgono infrastrutture di grandi dimensioni per prudenza, portando così a un sottoutilizzo e a costi elevati. Infine, le aziende vogliono un modello pay-as-you-go per evitare di pagare per le risorse non utilizzate.
“Cloudera DataFlow automatizza e gestisce i flussi di dati cloud-native su Kubernetes – ed è qualcosa che solo noi offriamo”, spiega Dinesh Chandrasekhar, Head of Product Marketing, Data-in-Motion di Cloudera. “Ora è facile per i nostri clienti aumentare l’efficienza operativa dei loro carichi di lavoro in streaming e risparmiare sui costi delle infrastrutture nel cloud pubblico”.
“Le aziende cercano di trovare l’equilibrio ideale tra efficienza e prestazioni da un lato e il controllo dei costi mentre scalano i loro carichi di lavoro in streaming”, aggiunge Maribel Lopez, fondatore e analista principale di Lopez Research. “L’adozione di architetture cloud ibride non fa che amplificare questa sfida. I leader tecnologici hanno bisogno di strumenti intelligenti che li aiutino a semplificare il processo di esecuzione e gestione dei carichi di lavoro nel cloud”.
Cloudera DataFlow per il Public Cloud è un potente servizio cloud-native per NiFi su Kubernetes e include capacità operative e di monitoraggio chiave che affrontano facilmente queste sfide e non sono tipicamente disponibili con i servizi dati standard:
- Catalogo centrale del flusso per la gestibilità, la scoperta e il controllo delle versioni;
- Dashboard centrale per monitoraggio, risoluzione dei problemi e ottimizzazione delle prestazioni dei flussi di dati su più cluster cloud
- Semplice wizard di installazione e solide API per la scalabilità automatica dei flussi su Kubernetes gestita da CDP
- Flussi pre-costruiti chiamati “ReadyFlows” per alcuni dei comuni casi d’uso dello streaming
Disponibilità
Cloudera DataFlow per il Public Cloud è in General Availability su AWS.