Oracle, per supportare gli sviluppatori nella realizzazione della nuova generazione di piattaforme per l’analisi dei big data, ha rilasciato API aperte e gratuite e il developer kit della propria tecnologia Data Analytics Accelerator (DAX) sui processori SPARC attraverso il Programma Software in Silicon dedicato agli sviluppatori, che consente loro di consultare alcuni casi di utilizzo, il codice di programmazione, di fare test e validare come DAX può accelerare le applicazioni di analisi dei dati testando anche la tecnologia Software in Silicon.
“Nell’analisi dei dati è fondamentale disporre di ottime performance come nel caso dell’analisi dei dati relativi ai clickstream, del sentiment sui social media, dei comportamenti di acquisto e altro ancora”, ha dichiarato John Fowler, Executive Vice President Systems di Oracle. “Grazie al nostro programma Software in Silicon dedicato agli sviluppatori, questi ultimi possono ora utilizzare la nostra tecnologia DAX in una serie di situazioni che prima non potevano essere risolte. Ciò è possibile perché abbiamo integrato nei processori l’accelerazione dell’analisi dei dati raggiungendo una velocità di scansione dei dati senza precedenti fino a 170 miliardi di righe per secondo“.
Con il rilascio del processore SPARC M7 a 32-core e 256 thread, Oracle ha creato una serie di funzionalità del Software in Silicon grazie alla creazione di funzioni software di livello superiore integrate nel processore stesso. Una delle funzionalità più interessanti introdotte nel processore SPARC M7, come parte delle innovazioni del Software in Silicon, è rappresentata da DAX.
Acceleratore dell’analisi dei dati integrato nel processore SPARC M7
DAX aggiunge capacità di elaborazione in grado di eseguire funzionalità selettive – scansione, estrazione, selezione e traduzione – a una velocità incredibilmente elevata. SPARC M7 DAX accelera queste analisi iniziali su un’unità fisica dedicata separata dai core di calcolo standard.
Lo sviluppo iniziale del software riguarda DAX per Oracle Database 12c e tutte le relative applicazioni, ampliando l’accelerazione dell’analisi a tutte le applicazioni Oracle, degli ISV e dei clienti.
Le operazioni di scansione e filtraggio su larga scala sono semplificate grazie a un uso trasparente dei 32 co-processori dedicati DAX all’interno del microprocessore SPARC che operano a velocità di bus di memoria fino a 160 GB/s tra cache e DRAM. Questi acceleratori, implementati per la prima volta on-chip per ottenere il massimo livello di prestazioni ed efficienza, possono ora essere utilizzati dagli sviluppatori grazie alle API di Oracle Solaris 11 e impiegati per una varietà di usi.
Come interessante esempio di integrazione di DAX nell’ambito dell’apprendimento automatico (machine learning) e dei Big Data, i progettisti Oracle hanno dimostrato che DAX può accelerare in modo significativo Apache Spark, è uno dei metodi più diffusi per l’elaborazione dei dati su larga scala. Attraverso questo progetto, gli ingegneri hanno utilizzato DAX con Apache Spark per tenere in memoria un miliardo di righe di dati e filtrarli in un cubo di dati tridimensionale così velocemente da rendere possibile l’analisi interattiva dei dati.