Auteur Sujet: Incendie OVH à Strasbourg: SBG2 complètement détruit. SBG1 détruit à 42%.  (Lu 311822 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 823
    • Twitter LaFibre.info
Ok, mais ils pouvaient couper le baies de SBG1 et alimenter SBG4, non ?

Il s'est passé autre chose ou il y avait autre choses que des batteries dans le local.

Je ne sais pas si un jour on aura la vérité.

py92

  • Abonné Free fibre
  • *
  • Messages: 62
  • Connected city
Il ne faut pas oublier que les onduleurs n'ont pas été coupés.

Si SBG2 et la moité de SBG1 ont brûlés, certaines salles ont continuées de fonctionner sur onduleurs, les batteries étant à plat et OVH ayant loué un groupe spécifiquement pour charger les batteries des onduleurs.

Par contre le réseau à du tomber avant la fin des batteries.

Je tente une explication en mode fiction. l'avenir nous le dira.

on sait maintenant que les 2 salles réseaux de SBG étaient dans SBG1 et SBG2 (detruit).
On devine que l'ensemble des fibres alimentant SBG3 depuis les salles réseaux dont celle de SBG1 passaient par SBG2 et donc fondu/detruite

A partir de 2H/2H30 SBG3 se retrouve totalement isolé au niveau réseau IP car toutes les fibres sont mortes.
Au niveau énergie lors de la coupure du site par Electricité de Strasbourg (je suppose) vers 2h30, SBG3 a basculé sur Diesel pendant plusieurs heures.
- hypothèse1: Voyant l’étendue des dégâts sur le site de SBG en général, OVH (ou les pompiers?) décide de couper les Diesels et donc de couper SBG3.
- hypothèse2: les diesels sont venu à cours de fioul au bout de 7h et ravitailler un diesel juste après un incendie c'était pas possible.

OVH sachant aussi pertinemment qu'il ne lui sera pas possible de redémarrer SBG3 avant plusieurs jours du fait de l'absence de réseau/fibre depuis SBG3 vers le reste du monde

vivien

  • Administrateur
  • *
  • Messages: 47 823
    • Twitter LaFibre.info
Je ne sais pas ce qu'on fait les deux salariés d'OVH présent sur site cette nuit, à partir de 1h du matin, mais je pense que couper intégralement l'électricité, les onduleurs et les groupes de DC1 et DC3 aurait été une bonne idée pour limiter l'ingestion de fumée.

Maintenant peut-être que à ce moment ils pensait que cela serait rapidement éteint.

DC4, je comprends qu'il n'ai pas été éteint, il est plus éloigné.


aplufr

  • Abonné Sosh fibre
  • *
  • Messages: 15
    • APLU
Des photos seraient intéressantes, car l'abandon de SG1 suite à de la fumée dans un local inutilisé de SBG1 est quand même un peu compliqué à comprendre, surtout que cela entraîne 5 jours de coupure totale pour SBG4, qui n'a plus d'énergie alors que tout était reparti.

Mais si facile à comprendre, il y'avait un SPOF pour l’alimentation de SBG4 parce que les câbles venait de SBG1 (ils ne font peut être que traverser les containers), du coup ils déplacent le SPOF sur SBG3.
D’ailleurs il me semble que la communication, c’est des batteries qui ne sont pas connecté et pas utilisé qui ont pris feu mais pas le containers dans lequel elles étaient.
Après c’est qui est surprenant c’est l’emplacement des groupes et le branchement électrique… pourquoi quand tu as des groupes à côté de SBG4 tu vas chercher sur les groupes qui sont à l’opposé ?… Et dans ce cas c’est pas plus simple de déplacer les groupes que de refaire une tranché pour alimenter via SBG3 ?

thenico

  • Expert.
  • Abonné OVH
  • *
  • Messages: 1 000
  • FTTH >500 Mb/s (13)
Sur mon dédié à SGB3, la perte du réseau date du 10/03/2021 01:47:57.
Le dernier log que j'ai pu trouver du 10/03/2021 02:27:48.

aplufr

  • Abonné Sosh fibre
  • *
  • Messages: 15
    • APLU
Je ne sais pas ce qu'on fait les deux salariés d'OVH présent sur site cette nuit, à partir de 1h du matin, mais je pense que couper intégralement l'électricité, les onduleurs et les groupes de DC1 et DC3 aurait été une bonne idée pour limiter l'ingestion de fumée.
Je pense que quand tu es devant un bâtiment complètement en feu tu n’as pas vraiment les idées très claire. Surtout que la nuit c’est probablement des tech moins qualifié qui ont pour mission de surtout surveiller les nagios, graphana et consort, en cas de pépin t’appelle l’astreinte ;)

py92

  • Abonné Free fibre
  • *
  • Messages: 62
  • Connected city
Je ne sais pas ce qu'on fait les deux salariés d'OVH présent sur site cette nuit, à partir de 1h du matin, mais je pense que couper intégralement l'électricité, les onduleurs et les groupes de DC1 et DC3 aurait été une bonne idée pour limiter l'ingestion de fumée.

Maintenant peut-être que à ce moment ils pensait que cela serait rapidement éteint.

Avec le recul c'est facile à dire......
Sur le moment, tu te vois prendre la responsabilité couper le jus (et le pouvait t-il?) à 30 000 ou 40 000 serveurs ???

si au final l'incident était maitrisé 10minutes ou 15minutes plus tard avec juste 2 onduleurs et qq batteries HS ??

et puis je suppose que quand la situation est devenue hors de contrôle c''était trop tard.

J'aimerai quand même mieux  comprendre ce qu'il se passe entre 0h47. Les camera thermique des pompiers ?  L'embrassement complet ? et la coupure globale du secteur d'ES vers 2h30

web7

  • Expert
  • *
  • Messages: 447
Les pompiers n'ont rien arrosés avant qu'ES ne coupe le courant sur la zone. Donc pendant ce temps... ça a cramé.

cali

  • Officiel Ukrainian Resilient Data Network
  • Fédération FDN
  • *
  • Messages: 2 403
    • Ukrainian Resilient Data Network
Des photos seraient intéressantes, car l'abandon de SG1 suite à de la fumée dans un local inutilisé de SBG1 est quand même un peu compliqué à comprendre, surtout que cela entraîne 5 jours de coupure totale pour SBG4, qui n'a plus d'énergie alors que tout était reparti.

Ouais, c'est bizarre de remplir un conteneur de batteries inutilisées à l'intérieur du DC...

Dans sa vidéo il parle d'un « petit incident », je crois qu'il ne prend pas en compte la répercussion...

vivien

  • Administrateur
  • *
  • Messages: 47 823
    • Twitter LaFibre.info
Si j'ai bien compris, ce sont des batteries usagées de SBG2, qui étaient en attente pour partir au recyclage.

OVH a pas mal de container sur ses différents sites.

Octave Klaba a même mis un container dans son jardin pour faire de la musique :

Si à 46 ans, tu n’as pas un conteneur dans ton jardin (pour faire un PoC), tu as raté ta vie.

Mon père:
- tu veux quoi pour ton anniv ?
Moi:
- un conteneur. j’ai eu une idée d’un projet et j’ai besoin ..

Nom de code : di2amp



Source : Twitter Octave Klaba, le 29 janvier 2021.

Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 6 140
La 3e vidéo d’Octave est là : https://x.com/olesovhcom/status/1374038409707188231
Par rapport aux vidéos d'Octave Klaba, je suis toujours aussi étonné que le discours ne soit pas préparé/filtré/corrigé par le service de communication.
Je sais que c'est la marque de fabrique d'OVH, ce genre de com sans filtre, mais quand même...

Et clairement, il s'exprime mal.
Ici, il dit qu'OVH va faire évoluer les standards du marché. Il le répète 5 fois, donc ça n'est pas une erreur ponctuelle.
Ce qu'il veut dire, j'espère en tout cas, c'est qu'OVH va faire évoluer les standards d'OVH, pas les standards du marché... Les standards du marché ne sont pas en cause à priori, vu qu'OVH ne les a jamais appliqués.
Je suis désolé, mais ce discours me choque.

Il semble dire que le "freecooling, c'est mal, c'est du passé". Et là non plus, je ne suis pas d'accord.
Le freecooling à la OVH, avec des salles largement ouvertes aux 4 vents, pas étanches, avec de l'air quasiment pas filtré, et des serveurs à seulement 1-2m de l'entrée d'air extérieure, oui, ça pose beaucoup de question, et depuis le tout début.
Les Freecooling à la Facebook et Scaleway, c'est forcément très très différent.

J'espère que les conclusions parleront également des procédures d'arrêt et de consignation électrique du site en cas d'incident grave : coupure totale (HT et BT), et coupure des onduleurs. Si ça a retardé de plus de 30 min l'intervention réelle des pompiers, comme on peut le lire ici, ça peut avoir du sens. Je ne dis pas qu'il y a eu un problème, c'est juste une hypothèse.

Leon.

web7

  • Expert
  • *
  • Messages: 447
Ouais, c'est bizarre de remplir un conteneur de batteries inutilisées à l'intérieur du DC...

Dans sa vidéo il parle d'un « petit incident », je crois qu'il ne prend pas en compte la répercussion...

Surtout que vu le poids et la manutention batterie par batterie tu ne t'amuses pas à les déplacer 36 fois avant de les mettre chez le ferrailleur...