Perché l'affidabilità degli UPS non è mai stata così importante

Un tasso di guasto pari allo zero non esiste, ma nel mondo dei servizi digitali la tolleranza verso le interruzioni è scesa a zero. Anche pochi secondi di downtime possono causare perdita di dati, indisponibilità del servizio o sanzioni contrattuali (violazioni degli SLA).
I data center aziendali e quelli per edge computing devono garantire il massimo periodo di operatività, avvicinandosi al 100%, all'interno di un ambiente più complesso ed esigente che mai.
 

Sfide chiave che dettano l'esigenza di affidabilità

  • Aumento dell'IA e dell'HPC: i carichi di lavoro aziendali impongono richieste gravose e imprevedibili, mettendo a dura prova le infrastrutture energetiche.
  • Attacchi informatici alle infrastrutture di base: tentativi di accesso non autorizzato possono disabilitare o destabilizzare i sistemi di alimentazione e raffreddamento.
  • Architetture ibride complesse: con l'edge computing, le implementazioni multisito e i modelli di cloud ibrido, la resilienza deve estendersi su più livelli.
     

Conseguenze per i data center

  • Le architetture ridondanti sono obbligatorie: le configurazioni Tier III / IV, 2N o N+1 stanno diventando lo standard per garantire la continuità.
  • Le apparecchiature UPS devono resistere a tutte le anomalie di alimentazione e garantire una continuità ininterrotta, indipendentemente dal comportamento e dalle dinamiche di carico.
  • Manutenzione "senza downtime" e supervisione proattiva: il monitoraggio predittivo, i moduli estraibili a caldo ("hot swap") e la diagnostica continua sono fondamentali per mantenere l'affidabilità su larga scala.

 

In questo contesto, l'affidabilità degli UPS modulari, quantificata da valori MTBF elevati, è diventata un fattore decisivo per gli operatori che mirano a garantire resilienza e disponibilità a lungo termine.

MTBF
RIDURRE I GUASTI
NEI SISTEMI MODULARI
Affidabilità
MASSIMIZZARE L'MTBF
DI OGNI MODULO

Che cos'è l'MTBF nell'UPS?

La probabilità di un guasto critico (perdita di carico) nel miglior sistema statico di continuità (UPS) modulare è estremamente bassa, grazie all'architettura ridondante e al design dei moduli di potenza, che funzionano in modo indipendente e possono isolare qualsiasi guasto interno per impedirne la propagazione.

Tuttavia, possono comunque verificarsi guasti casuali dei singoli moduli di potenza. Sebbene tali guasti non influiscano, di solito, sulla potenza erogata da un UPS modulare di alta qualità, questi compromettono la ridondanza del sistema e devono essere risolti per mantenere una tolleranza ottimale ai guasti.

La questione fondamentale è l'affidabilità di ciascun modulo di potenza: più moduli vengono utilizzati nel sistema, maggiore è il rischio complessivo di guasti. Il tasso di guasto interno dell'UPS aumenta con il numero di moduli e diminuisce con l'MTBF di ciascuno di essi.

Poiché il numero di moduli di potenza è determinato dai requisiti di alimentazione e ridondanza del sistema, l'unico modo per ottenere un'affidabilità complessiva accettabile è utilizzare moduli di potenza con un MTBF molto elevato, ovvero con un tasso di guasto eccezionalmente basso.

L'MTBF, ossia il tempo medio tra i guasti (Mean Time Between Failures), è la misura del tempo di funzionamento di un modulo prima che si verifichi un guasto. Più alto è l'MTBF, minore è il tasso di guasto e maggiore è l'affidabilità del modulo di potenza.


Perché l'MTBF è fondamentale per i data center

Nel corso dei 15 anni tipici di durata di un UPS, un MTBF elevato riduce significativamente il numero di guasti dei moduli. Questa riduzione non solo aumenta l'affidabilità del sistema, ma offre anche notevoli vantaggi economici e riduce al minimo i possibili rischi associati alla sostituzione dei moduli.
In termini pratici, un MTBF più elevato significa:

  • Meno guasti durante il ciclo di vita.
  • Costi operativi inferiori grazie a esigenze di manutenzione e sostituzione ridotte.
  • Maggior conformità agli SLA.
  • Maggiore sostenibilità.

Come viene calcolato e certificato l'MTBF

Poiché l'MTBF riveste un ruolo cruciale nel garantire l'affidabilità del sistema, questo viene calcolato attraverso una valutazione approfondita dei componenti e dei sottogruppi del modulo, utilizzando metodi statistici rigorosi, supportati da una serie di test mirati per verificare la resistenza meccanica, la durata e l'affidabilità a lungo termine.

Per garantire la credibilità del valore MTBF, la certificazione deve essere effettuata da un laboratorio indipendente e comprovata con dati reali acquisiti sul campo. Ciò conferma che l'MTBF predittivo non è solo teorico, ma si basa sulle prestazioni effettive.
In altre parole, l'affidabilità non è solo una promessa: viene dimostrata da test indipendenti e verificata attraverso dati acquisiti sul campo provenienti da migliaia di moduli che operano in condizioni reali.

La soluzione Socomec: MODULYS XM

MODULYS XM è l'UPS ultra-modulare progettato per garantire la massima tranquillità. I suoi moduli di potenza hanno un MTBF superiore a 1.000.000 di ore, quattro volte al di sopra dello standard di mercato. Questo calcolo è stato effettuato da un laboratorio specializzato indipendente dopo due anni di test rigorosi, con certificazione ufficiale disponibile su richiesta.

Dopo diversi anni e con oltre 50.000 moduli di potenza installati, che hanno accumulato più di 1 miliardo di ore di funzionamento, l'MTBF misurato è decisamente superiore a 1.000.000 di ore, superando il valore inizialmente calcolato. Su richiesta, è disponibile un report ufficiale relativo all'MTBF misurato, aggiornato ogni sei mesi.
Questo risultato è unico nel settore degli UPS e può essere ottenuto solo progettando moduli di potenza basati sull'affidabilità, non sul costo.
Grazie a MODULYS XM, i data center ottengono:

  • Design tollerante ai guasti.
  • Moduli estraibili a caldo ("hot swap") per una manutenzione priva di downtime.
  • Scalabilità per soddisfare le esigenze dei data center in continua evoluzione.
  • Certificazione indipendente e dati di affidabilità acquisiti sul campo aggiornati regolarmente.

Scopri Modulys XM
 

Esempio: MTBF di 1.000.000 di ore nella pratica
 

Supponiamo:
- Un sistema di 24 moduli UPS
- Un MTBF di 1.000.000 di ore per ogni modulo
- Ciclo di vita previsto: 15 anni = 131.400 ore

Guasti previsti = (24 × 131.400) ÷ 1.000.000 = ≈3 moduli in 15 anni.
Con un UPS modulare standard avente un MTBF di 250.000 ore, il numero aumenta a 12 moduli.

Ciò comporta un notevole risparmio sui costi, rischi minori e una maggiore disponibilità del sistema.
 

Impact du MTBF sur la durée de vie des modules

Spiegazione approfondita dell'MTBF

  • L'MTBF calcolato è il risultato dell'analisi dei fattori di stress per ciascun componente e sottosistema dell'UPS, oltre che dei test di stress.
  • L'MTBF misurato è ricavato da installazioni reali e dalle ore di funzionamento totali.
  • Entrambi sono essenziali: i valori calcolati forniscono previsioni, mentre i dati misurati le confermano nella realtà.

È importante sottolineare che l'MTBF deve essere considerato insieme all'MTTR (Mean Time To Repair). Un MTBF elevato riduce il numero di guasti, mentre un MTTR basso garantisce un rapido ripristino quando questi si verificano. Insieme determinano la disponibilità finale di un sistema UPS.
 

FAQ: moduli di potenza, guasti dell'UPS e MTBF

I moduli di potenza sono sempre affidabili?

I moduli di potenza degli UPS moderni vengono progettati ponendo l'affidabilità al primo posto. I processi di certificazione richiedono che i moduli siano sottoposti a rigorosi test di stress in laboratori indipendenti, dove vengono sottoposti a prove di temperatura, carico e durata. I dati reali acquisiti sul campo confermano spesso valori MTBF ancora più elevati, dando agli operatori dei data center la certezza che i moduli funzioneranno per lunghi periodi di tempo. L'affidabilità è inoltre migliorata dalle scelte progettuali: la separazione dei moduli isola i guasti, la progettazione estraibile a caldo ("hot swap") garantisce una sostituzione rapida e il monitoraggio predittivo aiuta a rilevare tempestivamente eventuali anomalie. Grazie a queste caratteristiche, i moduli non solo sono affidabili singolarmente, ma contribuiscono anche a creare un sistema UPS altamente tollerante ai guasti quando utilizzati in parallelo. Rispetto ai modelli UPS monolitici, le unità modulari di potenza riducono il rischio di singoli punti di guasto e aumentano la resilienza, motivo per cui stanno diventando sempre più lo standard sia dei data center aziendali che di quelli per edge computing.

Come capire se un UPS è guasto?

I segnali di un UPS guasto possono manifestarsi gradualmente o in maniera improvvisa, a seconda della causa. Gli indicatori comuni includono allarmi frequenti, autonomia ridotta durante le interruzioni dell'alimentazione, rumori insoliti provenienti dalle ventole o dai componenti elettronici e deterioramento visibile delle batterie (rigonfiamento, perdite). Gli operatori potrebbero anche notare prestazioni discontinue, come fluttuazioni di tensione o ripetuti allarmi dal software di monitoraggio. Nei sistemi avanzati, il monitoraggio predittivo fornisce avvertimenti tempestivi tracciando parametri quali l'impedenza della batteria, lo stato di salute dei condensatori, la temperatura e il bilanciamento del carico. Quando le soglie vengono superate, il sistema segnala un rischio di guasto, consentendo l'adozione di misure preventive. Nelle architetture UPS modulari, il monitoraggio viene eseguito a livello di modulo, rendendo più facile isolare la fonte della degradazione. È fondamentale individuare tempestivamente i guasti: se non vengono risolte, anche le anomalie minori possono trasformarsi in arresti imprevisti che compromettono l'operatività. Ispezioni regolari, unite a strumenti di monitoraggio intelligenti e a un design particolarmente affidabile, rappresentano i metodi più efficaci per mantenere l'affidabilità del sistema.

Come viene calcolato l'MTBF dell'UPS?

L'MTBF dell'UPS viene determinato utilizzando una combinazione di modelli di previsione dell'affidabilità, test di stress di laboratorio e conferma dei dati acquisiti sul campo. Nell'ingegneria dell'affidabilità, la stima primaria viene eseguita attraverso l'analisi dei componenti sottoposti a stress in conformità con norme quali IEC 61709, SN 29500 o MIL-HDBK-217F. Il tasso di guasto di ciascun componente è ricavato da database di riferimento e adattato utilizzando fattori di stress relativi a temperatura, tensione e ambiente. Questi tassi di guasto dei componenti vengono quindi inseriti all'interno di uno schema a blocchi dell'affidabilità (RBD) per modellare l'architettura UPS completa, compresi eventuali elementi ridondanti (N+1). Il tasso di guasto del sistema risultante (λ) fornisce il valore calcolato di MTBF = 1 / λ. I test di laboratorio vengono utilizzati per comprovare o perfezionare questi modelli. I componenti o i moduli vengono sottoposti a condizioni di stress accelerate (ad esempio temperatura elevata, umidità, vibrazioni e carichi ciclici) per confermare che i meccanismi di degradazione si comportino come previsto. Questi test supportano le ipotesi utilizzate nel modello di affidabilità, ma non determinano in modo diretto il valore MTBF. Poiché i test accelerati non sono in grado di riprodurre tutte le condizioni presenti sul campo, si analizzano anche i dati acquisiti sul campo provenienti dai sistemi installati. Le ore di funzionamento effettive e il numero di guasti su larga scala forniscono un MTBF misurato, il quale riflette le prestazioni reali. Nel caso di una base installata di grande portata, ovvero migliaia di moduli operativi per milioni o miliardi di ore totali, le statistiche che ne derivano diventano altamente affidabili. Laboratori indipendenti come SERMA o TÜV possono verificare la metodologia e la coerenza dei dati. Questo duplice approccio, MTBF previsto (analitico) e MTBF misurato (empirico), garantisce che il dato di affidabilità dichiarato sia tracciabile, credibile e rappresentativo degli ambienti operativi effettivi dei data center.

Cosa si intende per un buon MTBF?

Per i moduli di potenza UPS, un MTBF superiore a 1.000.000 di ore è davvero eccezionale. Tale valore indica un tasso di guasto teorico estremamente basso (λ ≈ 1 × 10⁻⁶ guasti/ora), ma deve sempre essere interpretato nell'ambito delle ipotesi del modello di affidabilità, ovvero tasso di guasto costante, nessun deterioramento e condizioni di installazione ideali. Per gli UPS modulari standard, i valori medi di MTBF sul campo per i moduli di potenza UPS sono compresi tra 200.000 e 300.000 ore, a seconda della qualità dei componenti, della temperatura ambiente, del profilo di carico e delle pratiche di manutenzione. Per applicazioni "mission critical" come i data center aziendali e quelli per edge computing, è fondamentale selezionare sistemi UPS con il più alto MTBF presente sul mercato. Una doppia valutazione, previsione analitica preferibilmente certificata da audit indipendenti (ad esempio SERMA o TÜV) e conferma empirica basata su una base installata di grande portata, garantisce che l'affidabilità dichiarata sia credibile, tracciabile e rappresentativa delle condizioni reali. In definitiva, un "buon MTBF" non è un numero astratto: è quello che supporta gli obiettivi del sito sanciti nello SLA, che consente di avere architetture tolleranti ai guasti e che riduce al minimo il rischio e il costo totale dei downtime durante il ciclo di vita dell'UPS.