Auteur Sujet: Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)  (Lu 16636 fois)

0 Membres et 1 Invité sur ce sujet

corrector

  • Invité
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #24 le: 02 septembre 2016 à 10:55:05 »
Est-ce qu'ils ont besoin d'être synchronisés?

Si oui, est-ce qu'une désynchronisation entraîne une panne?
Si non, pourquoi s'emm...?

BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #25 le: 02 septembre 2016 à 11:05:46 »
Comme l'a dit Arnaud, la synchro n'a vraiment d'intérêt que si les onduleurs n'ont pas la même source, s'ils sont sur des GE séparés par exemple (ou EDF + GE). Par défaut, chacun se synchronise sur EDF.

Il n'y en a absolument pas besoin, comme dit plus haut, 4ms de coupure ce n'est rien
pour un serveur qui en règle générale (je ne suis pas allé lire toutes les docs Dell / HP)
ne voit rien tant que ta coupure n'est pas au Hertz (20 ms).

C'est la doc de EATON qui le dit, pas moi. C'est pas la durée de coupure du point de vue du STS qui compte, c'est du point de vue du consommateur qu'elle est importante : si c'est non synchronisé t'as le risque d'une durée plus importante de coupure (crête à crête). Enfin, y'a aussi le risque d'un "power feedback".

Note: il y a aussi plusieurs scénarios de bascule possible pour un STS, certains nécessitent impérativement une synchro (les 2 sources sont actives pendant un très court laps de temps)

alexandreaj

  • Expert
  • *
  • Messages: 19
  • Riorges (42)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #26 le: 02 septembre 2016 à 11:59:08 »
Tu es vraiment certain qu'une synchronisation entre 2 onduleurs implique un SPOF?

De ce que j'ai compris, il y a un onduleur Maitre, et un onduleur Esclave. Et s'il y a un problème sur la liaison de synchronisation, alors chaque onduleur redevient "autonome", indépendant des autres.
Donc pour moi, ça n'est pas un SPOF.

Oui, une chaine unique d'onduleurs tous montées en parallèles synchronisés comporte un SPOF. Car si les onduleurs ne sont plus synchronisés, il va y avoir déséquilibre, et ils vont finir par se mettre en défaut (sur-intensité ou autre).
Mais 2 onduleurs électriquement séparés, et synchronisés entre eux, je ne vois pas en quoi ça présenterai un SPOF.

Leon.

Toutes mes excuses Leon, je me suis très mal expliqué. Je parlais des ATS en début de chaine Elec.
Pour l'observation sur les onduleurs, nous sommes d'accord, si tu veux "Clusteriser" tes onduleurs, prévoit plusieurs chaines Elec (même si tu ne les clusterisent pas d'ailleurs)

En plus, le fait de laisser le soin au client de mettre un ATS dans sa baie, réduit l'impact en cas de chute d'un équipement.
J'ai aussi déjà vu des montages de clients qui pour éliminer tous les SPOF utilisent 2 ATS/STS branchés tous deux aux 2 voies et chaque STS alimente une alim du End-Device.
(Ou encore plus de cascade mais je ne me souviens plus du montage exact alors je m'abstiendrais)

Mais là je crois que je pars en Hors-Sujet.


Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 5 981
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #27 le: 02 septembre 2016 à 12:41:15 »
Comme l'a dit Arnaud, la synchro n'a vraiment d'intérêt que si les onduleurs n'ont pas la même source, s'ils sont sur des GE séparés par exemple (ou EDF + GE). Par défaut, chacun se synchronise sur EDF.
Là, franchement, je n'ai pas du tout compris.
OK, quand la source est disponible, les onduleurs sont en phase avec la source.
Mais quand la source est absente pendant plusieurs minutes, aucune synchronisation entre onduleurs n'est possible sans dispositif particulier. Donc si on a besoin de synchro en aval des onduleurs, il faut mettre quelque chose!

Leon.

vivien

  • Administrateur
  • *
  • Messages: 47 168
    • Twitter LaFibre.info
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #28 le: 02 septembre 2016 à 14:06:50 »
En phase, si on part sur une coupure de plusieurs heures, il y a un risque important de ne plus être sychro entre les différentes chaînes (chacune chaîne ayant son groupe bien entendu)

Voici un scénario plausible :
- Panne ERDF de plusieurs heures (par exemple cause disjoncteur haute tension cassé un vendredi soir, pas de réparation possible avant lundi, coucou redbus)
- Après 2 jours sur groupe, un élèment de la chaîne A lâche
- Les serveurs derrières un STS passent de la chaîne A à la chaîne B qui est décalé de 1/4 de phase

abermingham

  • AS12876 Officiel Scaleway
  • Expert
  • *
  • Messages: 112
  • Paris (75)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #29 le: 02 septembre 2016 à 19:51:34 »
Là, franchement, je n'ai pas du tout compris.
OK, quand la source est disponible, les onduleurs sont en phase avec la source.
Mais quand la source est absente pendant plusieurs minutes, aucune synchronisation entre onduleurs n'est possible sans dispositif particulier. Donc si on a besoin de synchro en aval des onduleurs, il faut mettre quelque chose!

Leon.

Sauf que ... les onduleurs disposent de leur propre horloge et maintiennent la fréquence pendant la coupure (sur l'aval)
A la reprise, si il y a une légère désyncro, ils se recalent par rapport à l'amont. C'est aussi simple que ça.


abermingham

  • AS12876 Officiel Scaleway
  • Expert
  • *
  • Messages: 112
  • Paris (75)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #30 le: 02 septembre 2016 à 19:58:51 »
Tu es vraiment certain qu'une synchronisation entre 2 onduleurs implique un SPOF?

De ce que j'ai compris, il y a un onduleur Maitre, et un onduleur Esclave. Et s'il y a un problème sur la liaison de synchronisation, alors chaque onduleur redevient "autonome", indépendant des autres.
Donc pour moi, ça n'est pas un SPOF.

Oui, une chaine unique d'onduleurs tous montées en parallèles synchronisés comporte un SPOF. Car si les onduleurs ne sont plus synchronisés, il va y avoir déséquilibre, et ils vont finir par se mettre en défaut (sur-intensité ou autre).
Mais 2 onduleurs électriquement séparés, et synchronisés entre eux, je ne vois pas en quoi ça présenterai un SPOF.

Leon.

Concernant les onduleurs couplés/combinés :
OUI, SPOF, et déjà vu plein de fois. (dont un incident grave sur un DC en seine saint denis).
Nous avons déjà eut un incident de ce type sur des Galaxy 7000, un défaut de communication, le bypass se décide de fermer alors que les onduleurs débitent en même temps en mode Online. Les dégats étaient considérables.
Une carte de communication raccordée sur un bus commun a tous les onduleurs, si une carte crame, très souvent l'ensemble du bus est hors service, les onduleurs se découplent et bypass (quand ce scénario est correctement géré par le constructeur, ce qui est rarement/jamais le cas)
Il faut savoir que quand un onduleur crame, ca crame pour de vrai. J'ai déjà envoyé quelques photos sur twitter, ca flash sévère, surtout quand un IGBT s'envoie en l'air
Les onduleurs en "autonome" sont incapables de se répartir la charge, n'ayant pas les informations de courant d'échange des autres onduleurs de la même chaine. Ca ne marche qu'un temps, et encore.

D'expérience, avec une bonne cinquantaine d'onduleurs de forte puissance sur le terrain, seul Eaton s'en sort bien.

Sur des onduleurs séparés

Il n'y a une nouvelle fois aucun intérêt d'être en phase en sortie entre deux chaines différentes.
Et encore, même lorsque les chaines sont en mode GE, sur des GE séparés, même en opposition de phase, les STS vont commuter sans soucis, ils ont des condos pour ça.
Ce design à base de STS est vraiment à proscrire. Ca ne se fait plus depuis le début des années 2000. (le STS étant dans tous les cas un SPOF)

BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #31 le: 02 septembre 2016 à 20:26:36 »
Vu le nombre de STS 16A/32A que j'ai vu dans des DC "critiques" ces dernières années, j'ai dû tomber sur un paquet d'exceptions :)
Par contre, je suis d'accord que c'est de la cr**te, ça créé un SPOF.


vivien

  • Administrateur
  • *
  • Messages: 47 168
    • Twitter LaFibre.info
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #32 le: 02 septembre 2016 à 21:23:45 »
C'est nécessaire pour tous les serveurs et switch avec une seule alim.

Vous en voyez beaucoup des switchs de baie avec une double alim ?

BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #33 le: 02 septembre 2016 à 21:50:06 »
Les vrais switches pour DC, oui.

Par contre, les opérateurs (Orange et les autres) livrent très très rarement un équipement avec double alimentation, d'abord parce que souvent les routeurs petits/moyens ne le peuvent pas et ensuite, même sur ceux où c'est possible, ils n'ont pas la 2è alim. Sur les équipements optiques, ça dépend. J'ai vu du 48V avec un simple transfo au double atelier 48V.

abermingham

  • AS12876 Officiel Scaleway
  • Expert
  • *
  • Messages: 112
  • Paris (75)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #34 le: 02 septembre 2016 à 23:38:41 »
Vu le nombre de STS 16A/32A que j'ai vu dans des DC "critiques" ces dernières années, j'ai dû tomber sur un paquet d'exceptions :)
Par contre, je suis d'accord que c'est de la cr**te, ça créé un SPOF.

Haaa, tu parles de ces STS là, on en a quelques centaines aussi (voir milliers)
Ces d#ubes (peu fiables) font de toute façon un transfert avec coupure (8ms "théorique"), peu importe que ca soit en phase ou en opposition de phase, l'électronique ne contrôle même pas.

BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Panne de Delta Airlines: l'analyse (incendie dans le datacenter sur une chaine)
« Réponse #35 le: 05 septembre 2016 à 09:46:41 »
Alors pourquoi dans la doc Eaton ils disent le contraire ?

Le pré-requis d'un STS est d'avoir deux sources synchronisées sinon la bascule d'une source à l'autre peut être vue comme une instabilité en aval.

Exemple de doc : (cliquez sur la miniature ci-dessous - le document est au format PDF)


Maintaining synchronization is critically important for installations with dual power distribution systems. These sites typically feature Liebert Precision Power Centers (PPC) with Liebert Static Bus Transfer Switches (STSs). Each STS has dual inputs: it can receive power from any connected UPS, and switch seamlessly among the UPS systems as long as the UPS outputs are held in close synchronization. This provides redundancy down to the PPC level. It also permits one half of the distribution system (upstream of the STS) to be taken offline for maintenance or repairs.