Amazon Web Services (AWS) ha annunciato la disponibilità delle nuove istanze Amazon Elastic Compute Cloud (Amazon EC2) basate su processori Intel Xeon Scalable di quarta generazione personalizzati. Questo annuncio è il più recente tra un gran numero di istanze basate su Xeon di quarta generazione che offrono un costo di esercizio (TCO) tra i più competitivi del settore e la massima integrazione di acceleratori in qualsiasi CPU per sostenere carichi di lavoro quali intelligenza artificiale, database, networking e applicazioni aziendali.
“Intel ha lavorato a stretto contatto con AWS per portare i processori Xeon di quarta generazione agli utenti cloud, molti dei quali hanno potuto beneficiare in anteprima – pubblicamente e privatamente – delle loro prestazioni e valore. Oggi siamo felici di offrire lo stesso valore agli utenti cloud in tutto il mondo” commenta Lisa Spelman, Intel corporate vice president e general manager, Xeon Products and Solutions Group.
Le nuove istanze Amazon EC2 M7i-flex e M7i rendono disponibili in massa i motori di accelerazione Xeon di quarta generazione grazie alla presenza globale di AWS. Acceleratori integrati quali Intel® Advanced Matrix Extensions (Intel® AMX) offrono un’alternativa importante per quagli utenti che hanno una crescente domanda di carichi di lavoro AI. Xeon di quarta generazione con AMX può anche soddisfare le esigenze delle prestazioni di inferenza degli LLM (large language models) al di sotto di 20 miliardi di parametri, rendendone l’esecuzione su un’infrastruttura generica conveniente e sostenibile.
Più in generale, Intel e AWS offrono agli utenti una serie di opzioni di prodotto per soddisfare al meglio le loro esigenze di carico di lavoro, prestazioni e costi, insieme alla facilità e alla flessibilità necessarie per soddisfare le future esigenze dell’infrastruttura digitale.
A proposito delle istanze AWS: le istanze M7i-flex e M7i sono disponibili nelle seguenti regioni AWS: US East (Ohio), US East (N. Virginia), US West (Oregon) ed Europa (Irlanda).
Le istanze M7i-flex offrono:
· Il modo più semplice per ottenere vantaggi in termini di prezzo e prestazioni per la maggior parte dei carichi di lavoro generici.
· Progetti per eseguire facilmente carichi di lavoro generici, inclusi server Web e applicativi, desktop virtuali, elaborazione batch, microservizi, database e applicazioni aziendali.
· Un rapporto prezzo/prestazioni fino al 19%1 superiore rispetto alle istanze M6i.
Le istanze M7i offrono:
· Vantaggi in termini di rapporto prezzo/prestazioni per i principali carichi di lavoro, come database e server applicativi di grandi dimensioni, server per gaming, machine learning basato su CPU e streaming video.
· Istanze di dimensioni maggiori (fino a 192 vCPU e 768 GB di memoria).
· Nuovi acceleratori integrati che offrono maggiore efficienza nell’offload e nell’accelerazione delle operazioni sui dati, ottimizzando le prestazioni per i carichi di lavoro di database, crittografia e compressione, e gestione delle code.
· Un rapporto prezzo/prestazioni fino al 15%1 superiore rispetto alle istanze M6i