Il valore aziendale offerto dall’IA è sempre più evidente e le aziende si stanno affrettando a usufruirne prima della concorrenza. Per farlo, sarà però fondamentale ripensare la propria infrastruttura IT, perché le soluzioni di calcolo e di storage convenzionali a cui molte realtà si sono affidate finora non sono, molto spesso, realmente adatte a supportare l’Intelligenza Artificiale.
Una strategia di IA aziendale di successo richiede una data architecture costruita appositamente per l’IA. Questa architettura deve essere in grado di supportare diversi carichi di lavoro, distinguibili tra quelli di training del modello, che richiedono un’enorme capacità di calcolo e disponibilità di GPU, e di inferenza, che richiedono una latenza bassissima.
In quest’ottica, una risposta può arrivare dall’integrazione di pratiche di Cloud Adjacent Storage nella data architecture. Sfruttando la sua natura di immagazzinaggio distribuito e interconnesso in prossimità di più fornitori di cloud in tutto il mondo, è possibile infatti sfruttare i servizi cloud on demand, senza i costi e la flessibilità limitata che potrebbero derivare dall’utilizzo di servizi di immagazzinaggio cloud-native, ottenendo le prestazioni necessarie per supportare i carichi di lavoro dell’IA senza sacrificare privacy e controllo sui dati.
Eppure, nonostante gli evidenti vantaggi, il Cloud Adjacent Storage non è una strategia valida per tutti, soprattutto quando si tratta di casi di utilizzo dell’intelligenza artificiale.
Per ottenere i migliori risultati dal Cloud Adjacent Storage e sfruttare al meglio i vantaggi dell’Intelligenza Artificiale è dunque necessario seguire 5 step.
- Valutare i requisiti dei dati
Se non si capisce esattamente quali sono i requisiti di storage, difficilmente si riuscirà a soddisfarli. La costruzione di un ambiente di storage dell’IA deve iniziare con una valutazione completa delle esigenze dei dati, come la quantità di dati da archiviare necessariamente, la frequenza di accesso ai diversi dataset e soprattutto dove è necessario archiviarli per mantenere bassa latenza e soddisfare i requisiti di sovranità e residenza.
È inoltre importante considerare le caratteristiche specifiche dei carichi di lavoro dell’IA. La necessità di una bassa latenza è un dato di fatto, ma la domanda è: quanto bassa? E dove? Una volta attribuiti valori specifici ai requisiti geografici e di latenza, sarà più facile prendere decisioni informate sulla posizione dell’immagazzinaggio rispetto alle fonti di dati e ai luoghi di elaborazione.
- Pianificare un’integrazione perfetta
Quando si implementa il Cloud Adjacent Storage, è necessario collegare l’infrastruttura di storage a vari cloud provider, ma anche all’impianto in loco e alle edge locations. Ciò significa che è essenziale integrarlo nell’infrastruttura ibrida esistente causando il minor numero possibile di interruzioni.
Il Cloud Adjacent Storage per l’intelligenza artificiale funziona solo se i dati possono circolare liberamente tra i diversi ambienti. È necessario pensare a come configurare correttamente la propria rete per far sì che i dati si spostino da un punto all’altro, evitando al contempo i colli di bottiglia che potrebbero esacerbare la latenza, e quindi limitare l’efficacia dei modelli di IA.
L’utilizzo di una soluzione di rete virtuale può essere d’aiuto, in quanto consente di impostare o riconfigurare rapidamente le connessioni in qualsiasi momento.
È inoltre importante assicurarsi di archiviare solo i dati realmente necessari, soprattutto in un momento in cui i dati dell’IA sembrano destinati a crescere in modo esponenziale. L’integrazione di funzionalità di compressione e deduplicazione dei dati nel proprio ambiente di Cloud Adjacent Storage può aiutare a ridurre il carico di archiviazione e quindi a evitare che l’infrastruttura IA si sovraccarichi.
Inoltre è utile lavorare con fornitori di storage e infrastrutture digitali che abbiano una comprovata interoperabilità. Ciò consentirà una transizione senza problemi; in molti casi, si può continuare a utilizzare i sistemi esistenti di altri partner, anziché ricostruirli da zero.
- Garantire sicurezza e conformità
Quando si inseriscono i propri dati in modelli di intelligenza artificiale disponibili pubblicamente, si rischia di perdere la proprietà dei dati stessi. I dati vengono addestrati in un modello, ciò significa che le informazioni aziendali contenute potrebbero essere esposte a chiunque utilizzi il modello in futuro, compresi i concorrenti.
Il Cloud Adjacent Storage supporta l’obiettivo dell’IA privata offrendo un ambiente riservato e single-tenant per archiviare i dati derivanti dall’Intelligenza Artificiale. Da qui è possibile alimentare i modelli di IA senza che questi lascino mai il proprio controllo. Inoltre, è possibile mantenere la proprietà dei dati anche se si utilizzano servizi di cloud pubblico, per soddisfare i requisiti dell’infrastruttura IA. Per mantenere un approccio sicuro e privato, è necessario lavorare con un fornitore che offra funzionalità di sicurezza leader del settore, tra cui una crittografia robusta per i dati a riposo, politiche di controllo dell’accesso sicure, audit di sicurezza regolari per garantire che i dati rimangano protetti nel tempo e capacità di mitigazione di ransomware e DDoS.
Inoltre, utilizzando l’interconnessione privata per spostare il traffico tra le fonti di dati IA, l’infrastruttura di archiviazione e le sedi di elaborazione, è possibile evitare di esporre i dati sensibili alle vulnerabilità della rete Internet pubblica.
Se considerate nel loro insieme, queste funzionalità possono aiutare a dimostrare di aver adottato le misure appropriate per mantenere la riservatezza dei dati sensibili, come richiesto dalle normative di molte giurisdizioni in tutto il mondo.
- Ottimizzare le prestazioni
L’obiettivo dell’implementazione del Cloud Adjacent Storage è trovare le posizioni giuste per ridurre la latenza e accelerare l’elaborazione dei dati per le applicazioni IA.
Le prestazioni dello storage e il successo dell’IA hanno una relazione ciclica: è necessario un sistema di immagazzinamento ad alte prestazioni per supportare i casi d’uso dell’IA, alcuni dei quali possono aiutare a ottimizzare ulteriormente le funzioni dello storage. Ad esempio, gli algoritmi di AI possono aiutare a prevedere quali sono I dataset a cui si accede più frequentemente e quindi a spostarli automaticamente sui livelli di storage più veloci.
Per definizione, il Cloud Adjacent Storage distribuisce l’immagazzinamento in prossimità del cloud. Tuttavia, è essenziale ridurre la latenza e ottimizzare le prestazioni nell’intero ambiente IA, non solo da e verso il cloud.
Ciò significa mantenere lo storage vicino e perfettamente connesso all’infrastruttura per tutti i carichi di lavoro IA, indipendentemente dal fatto che il carico si trovi nel cloud, nel core on-premise o nel digital edge. È inoltre necessario implementare una connettività ad alte prestazioni tra le fonti di dati IA e l’ambiente d’immagazzinamento. In questo modo si garantisce che, quando vengono creati nuovi dati, i modelli di intelligenza artificiale possano iniziare a ingerirli senza ritardi e utilizzarli per ottenere informazioni tempestive.
Infine, l’ambiente di IA è in continua evoluzione, quindi l’ottimizzazione delle prestazioni non deve essere un’operazione sporadica. È necessario monitorare regolarmente lo storage nel corso del tempo e modificarlo in base alle esigenze per continuare a ottenere il livello di prestazioni richiesto dall’ambiente IA.
- Considerare scalabilità e flessibilità
Guardando al futuro, il volume di dati consumati dai modelli di intelligenza artificiale continuerà senza dubbio ad aumentare. Ciò significa che è necessaria una soluzione di storage altamente scalabile e flessibile per tenere il passo con la crescita esponenziale dei dati delle applicazioni, dei carichi di lavoro e di tutta l’infrastruttura che li collega.
Oltre ad espandere la capacità ogni volta che se ne presenta la necessità, la soluzione di storage deve anche integrarsi bene con le nuove tecnologie, se necessario. L’utilizzo di servizi come il Cloud Adjacent Storage può aiutare ad accedere alle funzionalità innovative necessarie per rendere l’infrastruttura IA a prova di futuro. La collocazione dello storage in prossimità di fornitori di colocation e cloud può garantire l’accesso alla più ampia varietà di servizi di ultima generazione.
Infine, nessuna strategia a prova di futuro sarebbe completa senza considerare la sostenibilità. Collaborare con un partner di infrastrutture digitali che offra le più recenti innovazioni in materia di sostenibilità dei data center può aiutare a implementare l’infrastruttura AI in modo pulito ed efficiente. Ad esempio, l’utilizzo del liquid cooling nei data center consente di ottenere la maggiore densità di elaborazione necessaria per carichi di lavoro impegnativi come l’IA, senza dover sacrificare l’efficienza per ottenerla.
Articolo a cura di Ian Botbyl Senior Manager, Product Marketing e Gabriel Chapman Director, Storage Solutions di Equinix