Cloudera ha annunciato la disponibilità generale di Cloudera Data Science Workbench, lo strumento self-service dedicato ai data scientist. La soluzione, annunciata in versione beta nel corso di Strata + Hadoop World San Jose 2017, mette a disposizione delle imprese una data science veloce, facile e sicura in modalità self-service.
“Stiamo entrando nell’era d’oro dell’apprendimento automatico e tutto è incentrato sui dati. Tuttavia, i data scientist continuano a faticare per creare e testare nuovi progetti analitici alla velocità desiderata, soprattutto in ambienti di grandi dimensioni”, ha affermato Charles Zedlewski, vice president senior Products di Cloudera. “Data Science Workbench è uno strumento self-service che accelera la capacità di creare, scalare e implementare soluzioni di apprendimento automatico utilizzando le tecnologie più potenti. Ciò significa che i data scientist oggi hanno la libertà di collaborare, condividere e gestire i propri dati nella modalità che meglio si adatta alla loro attività e alla loro azienda, agevolando un percorso più semplice e veloce per la produzione”.
Esperienza di data science self-service
Grazie a Python, R e Scala direttamente nel browser web, Cloudera Data Science Workbench offre un’esperienza di data science self-service, assicurando agli utenti la possibilità di scaricare e sperimentare le librerie e i framework più recenti in ambienti di progetto personalizzabili. Cloudera Data Science Workbench è sicuro e compatibile, con supporto per l’autenticazione, l’autorizzazione, la crittografia e la governance in Hadoop.
L’ufficio delle statistiche nazionali (ONS), il più grande produttore indipendente di statistiche ufficiali del Regno Unito, mira a utilizzare Cloudera Data Science Workbench per creare ricerche statistiche ripetibili, precise e trasferibili. “Abbiamo accertato un tempo inferiore nello sviluppo di modelli e una maggiore visibilità nel monitoraggio dei progressi e dei risultati”, afferma Simon Sandford-Taylor, Chief Technology Officer. “Riteniamo che Cloudera Data Science Workbench abbia il potenziale per accelerare il nostro calendario di rilascio e per condividere meglio le best practice”.
Data Science Workbench di Cloudera si integra facilmente con molti framework di deep learning, tra cui BigDL, una libreria di deep learning per Apache Spark, in open source da Intel. Creato per essere eseguito su infrastrutture distribuite Spark/Hadoop e con prestazioni ottimizzate per l’esecuzione su processori Intel Xeon (sfruttando la libreria Intel Math Kernel), BigDL opera direttamente all’interno di Cloudera Data Science Workbench.
“I clienti enterprise richiedono una piattaforma logica per scalare le proprie soluzioni di analisi e massimizzare gli investimenti. L’integrazione nativa di BigDL con Apache Spark porta il mondo del deep learning nell’ecosistema di Apache Spark e un valore più elevato per i clienti aziendali”, ha dichiarato Michael Greene, vice president e general manager System Technologies and Optimization del gruppo Software and Services, Intel Corporation. “Il framework BigDL aiuterà i clienti aziendali a utilizzare meglio gli investimenti esistenti per creare le proprie competenze analitiche con prestazioni ottimizzate sull’architettura Intel”.
I vantaggi dell’integrazione di BigDL in Data Science Workbench includono la capacità di sfruttare le librerie e le tattiche di deep learning sull’architettura della CPU senza ulteriori necessità hardware o ambienti separati. La combinazione, infatti, fornisce un modo conveniente per creare pipeline data science Spark in modo nativo e integrarle con la libreria di deep learning (BigDL) e altri componenti Spark/Hadoop sulla soluzione Cloudera Data Science Workbench.