Effectivement, s'ils font confiance au tel portable...
Dans les sites très sensibles, il y a des moyens de communication complètement dédiés normalement. Des téléphones filaires partout, sur un réseau téléphonique dédié, le plus simple possible (analogique). Ne surtout pas faire confiance au GSM ou à la VoIP pour des trucs sensibles.
Dans les "salles de contrôle" des installations sensibles (nucléaire, usines, pétrochimie, finance, etc), il n'est pas rare qu'une seule personne ait 2 ou 3 téléphones différents, sur des réseaux différents. C'est pareil sur les lieux sensibles de ces installations : des téléphones filaires, analogiques, robustes, répartis un peu partout où une intervention humaine sensible peut avoir lieux.
On peut installer jusqu'à 3 ou 4 téléphone pour chaque poste:
* 1 ligne interne normale (passant par le commutateur du site)
* 1 ligne France Telecom dédiée (analogique), ne passant pas par le commutateur du site, au cas où le commutateur déconne
* 1 ligne interne de secours, sur un réseau de secours dédié, genre "ligne rouge", avec sa propre numérotation téléphonique, au cas où les 2 ci dessus sont injoignables. Si ce réseau interne relie plusieurs sites, alors il emprunte de préférence des "liaisons louées" complètement séparées du reste. J'ai même vu (dans l'industrie) un tel réseau "très haute disponibilité", transportant de la voix et des données bas débits (transactions financières, ordres de production, commandes), réseau réalisé avec des liaisons louées redondées entre les sites, et des liaisons de secours par satellite (VSAT).
* On peut aussi mettre des téléphones "lignes rouge" qui passent par des lignes satellite dédiées genre Iridium, Inmarsat, ou Thuraya
Je précise que tout ça n'est pas de la fiction, c'est du réel!
Bref, la fiabilité, ça se joue à tous les niveaux. Les opérateurs de Datacenter devraient prendre exemple sur ce qui se fait dans l'industrie sensible. Tous ces problèmes ont été bien étudiés dans l'industrie.
Dans l'incident du DC2 d'ILIAD, ils auraient peut-être pu appliquer la sollution palliative, à savoir redémarrer le groupe électrogène, si la consigne des "experts" (non présents sur place) était parvenue à temps Ce n'est qu'une hypothèse, mais elle me semble plausible.
10:26:30 Un deuxième groupe électrogène, celui de la chaine A (GE-A), s’arrête en défaut « électronique ».
[...]
11:29:18 Fin d’autonomie batterie des onduleurs de la chaine A. Coupure de l’alimentation ondulée de la salle 103
11:41:23 Remise en service du groupe électrogène GE-A en « marche forcée » (arrêt de son automate, les défauts sont inhibés et ignorés) pour réalimenter la chaine A. L’opération fonctionne, retour de l’énergie dans toutes les salles
Sauf que dans ton milieu, tu as la maitrise de la conception des équipements et/ou tu as un large choix de composants. Idem en aéronautique où on est encore plus sensible à l'évaluation des risques.
En alimentation de type HT pour utilisation Datacenter, on n'a pas beaucoup de choix technologiques : les automates, y'en n'a pas 10000 sur le marché et tous peuvent tomber en panne. Y'a pas grand-chose à redire de l'architecture de Online DC2, les pannes en cascade ça arrivera toujours.
Tu te trompes sur mon métier. Je travaille pour un grand constructeur automobile français, dans le domaine de l'électronique. Et dans de très nombreux cas, pour certains calculateurs spécialisés, nous n'avons le choix qu'entre 2 ou 3 fournisseurs, qui proposent leur solution sur étagère, qu'ils adaptent à nos besoins... Bref, exactement comme un constructeur d'installation industrielle (datacenter y compris).
Je ne suis surtout pas d'accord avec ta dernière phrase : "les pannes en cascade ça arrivera toujours". Clairement, non. Comme nous le disons avec Corrector : si un événement très très improbable arrive, c'est qu'on n'a pas pris toutes les mesures pour qu'il soit si improbable que ça. Si on voit un jour un événement censé arriver à une probabilité de 10e-9/heure, c'est que la probabilité a été très largement sous-estimée. La probabilité théorique de défaillance de 3 groupes sur 6 doit être de cet ordre de grandeur là!
Je sais, ça semble un peu facile pour un oeuil extérieur, ça ressemble à du "yaka fautqu'on", mais j'assume!
Leon.