La quantità di dati generati dalla nostra società sta aumentando a un ritmo esponenziale, complice anche la repentina digitalizzazione dei Paesi, accelerata dalla pandemia di Coronavirus. IDC prevede che entro il 2025 la quantità di dati generati supererà i 175 ZetaByte all’anno.
Alla luce di queste premesse è davvero importante che le aziende e i loro responsabili IT sappiano valutare e scegliere soluzioni e sistemi di archiviazione in grado di supportare un’importante mole di dati senza rischiare l’overload o comprometterne la loro disponibilità.
SSD vs HDD: importante considerare lo scenario d’utilizzo
Negli ultimi anni si è assistito a un vero e proprio boom delle unità a stato solido (SSD). I produttori ne hanno promosso la velocità operativa e la maggiore robustezza rispetto alle unità a disco rigido (HDD) e di conseguenza gli SSD hanno, pian piano, sostituito gli HDD in molte aree di applicazione, in particolare in ambito consumer. Ma quando si tratta di implementazioni nei data center, il quadro si capovolge e il ruolo degli hard disk resta ancora primario.
Se si confronta un SSD con 2500 GigaByte/s di larghezza di banda e 100kIOPS di prestazioni operative con il più veloce HDD (che sarà in grado di fornire 250MByte/s e 300IOPS), i vantaggi possono sembrare chiari, ma ai fini di una valutazione completa è importante considerare anche il loro scenario d’utilizzo. Ad esempio, nei data center, il confronto tra singole unità (come avverrebbe in un computer portatile), non è valido. Negli attuali sistemi di archiviazione possono esserci centinaia di queste unità coinvolte – che potenzialmente rappresentano PetaByte di capacità di storage.
Per i sistemi di archiviazione ad alta capacità su larga scala, il prezzo/GigaByte è il parametro chiave che deve essere considerato quando si fa un investimento – e in questo campo gli HDD continuano a dimostrare il loro primato. Negli ultimi dieci anni, c’è stata un’importante forbice tra il prezzo/GigaByte degli HDD aziendali e quello degli SSD aziendali e anche se la riduzione del costo degli SSD ha permesso a queste unità di recuperare punti e popolarità rispetto agli HDD, c’è ancora una differenza di circa 8x (quando si confrontano le stesse applicazioni e la stessa classe). Si prevede infatti che, in futuro, le curve dei prezzi rimangano più o meno parallele – e che il punto di crossover non avvenga prima del 2030. La ragione sta nel fatto che anche se i prezzi degli SSD stanno scendendo, l’innovazione nella tecnologia HDD e l’ottimo rapporto prezzo/GigaByte continuano a rivelarsi più vantaggiosi in termini di costi. E qualora si volesse ipotizzare che il prezzo/GigaByte degli HDD fosse improvvisamente alla pari con gli SSD, allo stato attuale delle cose, non ci sarebbe abbastanza capacità di produzione di memoria flash per sostituire tutte le risorse HDD con equivalenti a stato solido.
Affinché l’SSD sostituisca completamente l’HDD, la produzione di SSD dovrebbe aumentare di 6 volte. Solo il raddoppio di questa produzione costerebbe centinaia di miliardi di dollari, mentre un aumento di 6 volte richiederebbe migliaia di miliardi. Inoltre, tutto questo basterebbe solo a coprire la capacità di archiviazione del 2019 e non sarebbe sufficiente per soddisfare le migliaia di ExaByte che si prevede saranno necessari entro il 2023 e oltre.
Fare affidamento su un solo approccio, basato sulla memoria flash, non è funzionale. Con la crescente attività dei servizi cloud, accelerata dall’epidemia di Covid-19, la validità degli HDD in contesti come data center è stata ulteriormente dimostrata. Un recente report pubblicato da Statista lo conferma, sottolineando che le spedizioni di HDD aziendali ad alta capacità sono destinate a continuare a crescere nei prossimi anni.
Quando la velocità nell’archiviazione non è tutto
Un singolo HDD è più lento di 10 volte rispetto ad un SSD, ma quando si parla di sistemi di archiviazione ultra-large tutto cambia. Attraverso l’implementazione di architetture intelligenti, più HDD possono essere utilizzati insieme per eguagliare le prestazioni di un sistema comparabile, in termini di prezzo, composto da pochi SSD.
Come sottolineato in una nota ufficiale da Rainer W. Käse, Senior Manager Business Development, Storage Products Division at Toshiba Electronics Europe: «Nel laboratorio Toshiba abbiamo analizzato architetture con 24-60 HDD sia con configurazioni RAID10 e sia con software-defined: entrambe sono state in grado di fornire parametri di performance superiori a 10kIOPS e 5GigaBytes/s. Quindi, per i sistemi di archiviazione di maggiore capacità, una soluzione con molti HDD, a un costo unitario molto più basso, risulterà la soluzione migliore dal punto di vista del costo per capacità rispetto a una con un minor numero di SSD, che hanno ciascuno un costo unitario molto più alto».
Seppur oggi la percezione più comune sia che le soluzioni di storage basate su HDD consumino più energia, nelle implementazioni con carichi di lavoro reali la quantità di energia richiesta dai dischi rotanti è spesso sovrastimato. Il consumo di energia è inferiore a quello atteso, specialmente se vengono utilizzate unità moderne ad alta capacità e helium-filled. Per ciò che concerne l’affidabilità i moderni HDD aziendali, con MTTF di 2,5 milioni di ore, sono direttamente paragonabili a qualsiasi SSD in relazione alla loro durata di vita. Inoltre, gli HDD non hanno limiti sulla quantità di dati scrivibili da gestire nel loro ciclo di vita, mentre gli SSD hanno una resistenza relativamente limitata. Con i carichi di lavoro in costante cambiamento, soprattutto nei data center, questo aspetto è molto vantaggioso.
In conclusione, sulla base dei prezzi attuali e delle proiezioni dei prezzi futuri, gli HDD restano ancora la soluzione più valida per archiviare dati su larga scala. Il prezzo/capacità degli SSD e la mancanza di un’adeguata produzione non permetteranno di soddisfare il boom di dati che si delinea all’orizzonte, favorendo invece l’utilizzo della tecnologia HDD.