La progettazione di sistemi e dispositivi per il funzionamento continuo nei data center comporta difficoltà uniche quando se ne deve testare l’affidabilità. La soluzione: esporre i componenti a condizioni ambientali estreme per farli obsoletare artificialmente e testarne le prestazioni.
I data center sono un’infrastruttura critica per il nostro mondo sempre più connesso. Tuttavia, gli ambienti in cui operano possono essere difficili per le apparecchiature che si trovano al loro interno. Fattori quali calore, umidità e polvere possono causare guasti del sistema, tempi di fermo e perdita di dati. Ciò consolida la necessità di test ambientali approfonditi.
Dal momento che i data center operano 24 ore su 24, i componenti che ne consentono il funzionamento devono essere sottoposti a test di affidabilità per un lungo periodo di tempo: uno scenario difficile per i dispositivi in servizio continuo con una durata pluriennale. Esponendo i componenti a condizioni più estreme di quelle che potrebbero sperimentare in condizioni normali, gli ingegneri possono eseguire una Prova di vita accelerata (Accelerated Life Testing, ALT) per determinare con più rapidità quando una parte si guasterà e ottimizzarla al meglio per l’ambiente previsto.
Ad ogni modo, anche la prova ALT presenta delle difficoltà. Nei data center, l’ambiente operativo tradizionale è stato caratterizzato in passato dal raffreddamento ad aria. Tuttavia, l’immersione sta diventando la tecnica di raffreddamento preferita, e gli standard e i metodi di test correnti non trattano le variabili uniche coinvolte in questo scenario di raffreddamento.
In che modo gli architetti del sistema e gli ingegneri di progetto odierni possono ottimizzare i loro dispositivi per garantire un’affidabilità a lungo termine? La prova ALT è un ottimo punto di partenza.
Cos’è la Prova di vita accelerata?
La Prova di vita accelerata (Accelerated Life Testing, ALT) è il processo durante il quale i prodotti o i componenti sono sottoposti a condizioni estreme al di fuori dei parametri operativi standard per far obsoletare artificialmente l’elemento da testare, identificare i difetti e prevedere le prestazioni durante il normale funzionamento. I fattori tipici includono il ciclo termico, l’umidità, gli urti, le vibrazioni e altri criteri. Per un data center in cui i sistemi e i dispositivi spesso operano in maniera continua e per periodi di tempo prolungati, i test tradizionali potrebbero richiedere anni. La prova ALT accelera il processo e consente a un produttore di ridurre in maniera significativa i tempi di prova, accelerare lo sviluppo del prodotto e determinarne la durata complessiva.
Tipi di prova ALT
Sebbene a volte si considerino diverse classificazioni di test, la prova ALT generalmente può essere suddivisa in due categorie, quantitativa e qualitativa, e ognuna include una moltitudine di tipologie di test.
Metodi ALT quantitativi
Nella prova ALT quantitativa, l’obiettivo è determinare la durata prevista di un dispositivo accelerando il tempo al guasto e producendo dati per valutare l’affidabilità con un fattore d’influenza specifico. In genere, ciò avviene utilizzando una di due tipologie generali:
Accelerazione per sovra sollecitazione – Questo è il metodo preferito per prodotti a funzionamento continuo o ad altissimo utilizzo esposti a sollecitazioni che superano il normale utilizzo. Ad esempio, un prodotto o componente può essere esposto a temperature molto alte con l’idea che l’esposizione a temperature estreme in periodi di tempo ridotti simuli esattamente l’esposizione a temperature normali nel corso della durata di vita prevista. Test simili possono essere eseguiti per fattori quali umidità e vibrazioni. A causa della natura continua dei data center, i test di accelerazione per sovra eccitazione sono critici.
Accelerazione del tasso di utilizzo – Per i prodotti che non funzionano in modo continuo, questi test vengono utilizzati per simulare più rapidamente un guasto eseguendo una funzione a un tasso maggiore o più frequente. Ad esempio, i connettori vengono testati per determinare i loro cicli di accoppiamento o il numero di volte in cui un connettore può essere collegato e scollegato continuando a soddisfare le specifiche di prestazione. Per accelerare il test, il processo di collegamento e scollegamento può essere eseguito più rapidamente quando le forze meccaniche coinvolte sono uguali alle normali condizioni operative e a cambiare è solo la frequenza.
Metodi ALT qualitativi
Mentre l’ALT quantitativa produce dati per misurare la durata delle prestazioni di un prodotto in presenza di sollecitazioni specifiche, l’ALT qualitativa identifica la causa del guasto e viene spesso eseguita su un campione di dimensioni più ridotte. I test ALT qualitativi variano, ma possono includere:
Prova di vita altamente accelerata (Highly Accelerated Life Testing, HALT) – Con la prova HALT, un prodotto viene sottoposto a una serie di sollecitazioni simultanee e indipendenti, come temperatura e vibrazioni, per identificare dove e perché si verifica un guasto. Sebbene le sollecitazioni possano essere uguali o simili a quelle dell’ALT quantitativo, l’obiettivo dell’HALT non è quello di misurare la durata delle prestazioni di un prodotto, ma piuttosto identificare il modo in cui si guasta.
Screening di stress altamente accelerato (Highly Accelerated Stress Screen, HASS) – Dopo che l’HALT è stato finalizzato e la progettazione è stata completata, l’HASS può fungere da test finale per garantire l’affidabilità all’inizio della produzione. Sebbene l’HASS esponga il prodotto in esame alle stesse sollecitazioni dell’HALT, l’HASS viene utilizzato nello specifico come parte del processo di screening della produzione.
Le varianti dei test ALT qualitativi comprendono i test shake and bake, i torture test e gli elephant test.
Prova ALT dei connettori: EIA-364
Lo standard EIA-364 Procedure di test per connettori elettrici/prese incluse le classificazioni ambientali definisce le sequenze e le procedure minime raccomandate di test per i connettori elettrici e le prese, incluse le prove ALT. Ogni standard EIA-364 valuta criteri specifici, come la forza di accoppiamento e disaccoppiamento (EIA-364-13), l’umidità (EIA-364-31), la durata (EIA-364-09) o i cicli termici (EIA-364-110) e funge da riferimento per le prestazioni dei connettori in base agli ambienti in cui verranno utilizzati.
Per le apparecchiature dei data center, si applica solamente la Metodologia di test ambientale per la valutazione delle prestazioni dei connettori elettrici e delle prese utilizzati in applicazioni in ambiente controllato EIA-364-1000. Originariamente progettato per applicazioni in uffici commerciali, ECIA-364-1000 copre un uso relativamente blando e in ambienti controllati, come i dispositivi all’interno dei data center.
Sebbene i test EIA-364 siano raccomandazioni e non requisiti, sono diventati uno standard industriale e costituiscono le linee guida ALT per molti produttori.
Le sfide dell’ALT in ambienti liquidi
Mentre l’EIA-364 e altri standard ALT forniscono chiare linee guida di affidabilità per gli ambienti tradizionali con aria, l’ALT per i componenti utilizzati in applicazioni di raffreddamento a immersione è molto meno definito. La sfida è rappresentata dal fatto che sul mercato esistono già più di una dozzina di fluidi dielettrici proprietari, tutti con prestazioni diverse. Ciò significa che un produttore deve eseguire l’ALT per più di 12 fluidi oltre all’aria? Sarà necessario produrre prodotti diversi per ogni mezzo?
L’Immersion Project di Open Compute Project (OCP) mira a rispondere a queste e ad altre domande utilizzando input e informazioni degli esperti del settore per formare un gruppo di lavoro dedicato al raffreddamento a immersione. Mentre il raffreddamento ad aria è stato il metodo tradizionale per abbassare le temperature dei server nei data center, il raffreddamento a immersione si è dimostrato più efficiente dal punto di vista energetico e dei costi richiedendo meno spazio. Attraverso l’Immersion Project, l’OCP sta lavorando per stabilire definizioni, specifiche, requisiti di compatibilità e migliori prassi standardizzate sia per le soluzioni di immersione che per le apparecchiature pronte per l’immersione.
Idealmente, grazie alla guida di organizzazioni come OCP, i produttori saranno in grado di progettare un unico prodotto che funzioni in modo affidabile in tutti gli ambienti raffreddati a liquido e ad aria. Per gli architetti di sistema e gli ingegneri di progetto, questo semplificherà la distinta base e ridurrà al minimo il rischio di confusione ed errori. Gli ingegneri sono entusiasti di giocare d’anticipo. Infatti, una recente indagine di Molex sull’affidabilità e la progettazione dell’hardware ha rilevato che il 51% dei 756 intervistati si impegna già per soddisfare le certificazioni e gli standard di affidabilità del settore possibili in futuro, oltre ai requisiti attuali.
Molex apre la strada a data center più affidabili
In qualità di pioniere del settore delle applicazioni per data center ad alta velocità, Molex investe molto nelle capacità ALT e contribuisce attivamente all’OCP, compreso l’Immersion Project. Siamo impegnati a garantire prestazioni affidabili dei data center, indipendentemente dal mezzo, e il nostro ampio portafoglio di soluzioni di interconnessione è progettato per soddisfare le linee guida EIA-364 e OCP attuali e in evoluzione.