Grazie alla nuova piattaforma z/OS per Apache Spark, IBM è ora in grado di rendere più agevole e veloce l’accesso e l’analisi dei dati in-place sui mainframe IBM z Systems. Questo vuol dire più opportunità per data scientist e sviluppatori che in tal modo possono applicare strumenti di analitica avanzata agli insiemi di rich data e di conseguenza possono trarre informazioni utili in tempo reale.
La piattaforma IBM z/OS per Apache Spark consente di eseguire Spark, un framework di analitica open source, in modalità nativa sul sistema operativo mainframe z/OS. La nuova offerta permette di analizzare i dati in-place direttamente nel sistema, senza necessità di estrarli, trasformarli e caricarli (ETL), spezzando così il vincolo tra la libreria di analitica e il file di sistema sottostante.
Nell’era del cognitive computing, in cui i dati sono la nuova risorsa naturale e i sistemi informatici sono in grado di comprendere, elaborare concetti e apprendere, le aziende devono essere in grado di sviluppare e sfruttare rapidamente le informazioni utili, prima che perdano rilevanza. Grazie a questa offerta, che include acceleratori sviluppati da business partner z Systems, le organizzazioni possono trarre più facilmente vantaggio dai dati e dalla capacità di z Systems e possono prendere decisioni di conseguenza in tempo reale, velocizzando il time to value.
z Systems gestisce già transazioni e dati critici per molte delle principali organizzazioni in tutti i settori a livello mondiale. È dotato del microprocessore commerciale più veloce del mercato e ha la capacità di eseguire funzioni di analitica in-transaction, elaborando modelli predittivi con transazioni nell’ordine di meno di 2 millisecondi. Le aziende possono ora utilizzare queste funzionalità, applicando funzioni di analitica avanzata in-memory attraverso Spark, senza necessità di trasferire i dati al di fuori del mainframe, risparmiando quindi tempo e denaro e limitando il livello di rischio.
La piattaforma IBM z/OS per Apache Spark include le funzionalità open source di Spark, vale a dire Apache Spark Core, Spark SQL, Spark Streaming, Machine Learning Library (MLlib) e Graphx, combinate con la soluzione Spark di astrazione dati (unica del settore) residente su mainframe.
Questo approccio permette di rendere i moderni strumenti open source più accessibili, consente agli sviluppatori di scegliere i propri strumenti e linguaggi di lavoro, fornendo nuovi supporti visivi per monitorare i risultati “analytics” attraverso svariati ambienti di dati e permette di sfruttare le competenze le tecniche di elaborazione dei dati più avanzate.