Auteur Sujet: Rapport d’enquête BEA-RI sur l’incendie du datacenter OVH de Strasbourg en 2021  (Lu 91025 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 48 042
    • Twitter LaFibre.info
À noter le lancement de SBG5, à Strasbourg.

=> OVH Strasbourg 5

  • Invité
L'extinction par brouillard d'eau est, avec notre expérience, la meilleure solution.
Les qualités sont nombreuses : pas de risque pour les disques durs, pas de risque de surpression explosive, pas de risques pour les humains, durée d'extinction quasi illimité, très peu de dégâts sur les matériels, pas de compartimentage très étanche à réaliser avec les risques qui vont avec (Clapets, DAS, etc...). Les assurances aiment moyennement car ne rentre pas dans la catégorie des systèmes d'extinction APSAD R13, des sombres histoires de lobbing
Nous avons déjà fait un test grandeur nature, il y a presque 10 ans, la vidéo est disponible sur YT :
Intéressant cette expérience, mais 12mn pour éteindre un petit départ de feu de papiers/cartons ça paraît très long. Ça donne quoi pour éteindre un incendie électrique par exemple?
Autrement dit, question idiote sans doute mais est-ce que cette technique est capable d'éteindre des départs d'incendies plus "sérieux" avec des combustibles plus représentatifs de ce qu'on trouve en DC?

vivien

  • Administrateur
  • *
  • Messages: 48 042
    • Twitter LaFibre.info
Dans un datacenter, le risque est limité dans les salles d'hébergement des serveurs : ce qui brule est limité et le brouillard d'eau semble adapté.

Le risque des batteries est depuis longtemps identifié et l'incendie d'OVH a fait ouvrir les yeux sur les risques possibles aux endroits où il y a de forts courants (ou du combustible).

Pour exagérer volontairement, on voit bien qu'ici le brouillard d'eau n'est pas adapté :
Impressionnant !

Panne hydraulique sur une ligne d'extrusion d'aluminium de l'entreprise d'aluminium Alueuropa SA à Séville, en Espagne.


La situation se dégrade à une vitesse incroyable. Un plafond suspendu dans un endroit comme celui-ci (extrusion d'aluminium à plus de 1000 degrés) est clairement une mauvaise idée.

Je me demande si un arrêt d'urgence enfoncé aurait permis d'éviter que cela dégénère autant. Cela n'aurait permis que quelques secondes de pulvérisation par le haut, au lieu d'un flux constant.




Par chance, il n'y a aucun blessé.

  • Invité
Dans un datacenter, le risque est limité dans les salles d'hébergement des serveurs : ce qui brule est limité et le brouillard d'eau semble adapté.
Selon qui, d'après quelles études?

J'ai déjà vu un départ d'incendie sur une alimentation dans un serveur 2U: les composants (notamment les condensateurs) qui brûlent ça ne s'éteint pas en soufflant dessus... Et je ne parle pas des gaines plastiques des câbles: sont-elles systématiquement FR-LS?

D'où ma surprise sur le test à base de quelques papiers qu'on crame dans un coin de la pièce (scénario dont on ne voit pas bien la transposition en situation réelle), et ma question (naïve sans doute).

JeannotPlanche

  • Expert Scaleway
  • Abonné Free fibre
  • *
  • Messages: 139
  • 93
Rapport d’enquête BEA-RI sur l’incendie du datacenter OVH de Strasbourg en 2021
« Réponse #100 le: 14 septembre 2022 à 19:52:59 »
Remarque en passant :
J'ai vu une seule fois en DC un serveur qui a (relativement) bien brûlé, ça s'est arrêté tout seul et ça n'a pas déclenché l'extinction, heureusement.


vivien

  • Administrateur
  • *
  • Messages: 48 042
    • Twitter LaFibre.info
Rapport d’enquête BEA-RI sur l’incendie du datacenter OVH de Strasbourg en 2021
« Réponse #101 le: 14 septembre 2022 à 22:20:48 »
C'est un disque qui a brulé ?

JeannotPlanche

  • Expert Scaleway
  • Abonné Free fibre
  • *
  • Messages: 139
  • 93
Rapport d’enquête BEA-RI sur l’incendie du datacenter OVH de Strasbourg en 2021
« Réponse #102 le: 14 septembre 2022 à 22:26:35 »
Un ventilateur, par une cause inconnue.
Je m'étais amusé à tester les disques et une carte RAID et ils fonctionnaient parfaitement !

  • Invité
Rapport d’enquête BEA-RI sur l’incendie du datacenter OVH de Strasbourg en 2021
« Réponse #103 le: 15 septembre 2022 à 09:40:34 »
Un ventilateur, par une cause inconnue.
Une hypothèse: ventilo bloqué. Le courant augmente, la bobien chauffe, ça fond et hop. ça arrive.

vivien

  • Administrateur
  • *
  • Messages: 48 042
    • Twitter LaFibre.info
L’incendie d’OVHcloud couve toujours

Article de Data Center Dynamics du 28 mars 2024, rédigé par Peter Judge et traduit de l'anglais.


Trois ans après l'incendie d'un data center OVHcloud, il reste plus de questions que de réponses sur l'incident

Il était 00h40, le mercredi 10 mars 2021. Jusque-là, SBG2 n'était qu'un banal data center situé sur un site industriel sans grand intérêt à Strasbourg, petite ville surtout connue pour son rôle de plaque tournante de la bureaucratie européenne.

SBG2 arborait un grand logo OVH (le nom complet de son propriétaire est OVHcloud) aux côtés de ce genre de bardage coloré qui égaye souvent un établissement dont la façade n'a pas d'autres éléments distinctifs. Ses cinq étages offraient 500 m² d'espace de centre de données sur la rive ouest du Rhin, là où la France borde l'Allemagne.

On ne sait pas exactement ce qui s'est passé ensuite, mais d'ici six heures, SBG2 serait le centre de données dont on parle le plus au monde.

Avant l’aube, le feu avait ravagé le bâtiment. Son revêtement brillant était une coquille déformée et fumante. Les 30 000 serveurs à l'intérieur ont été détruits et le SBG1 adjacent a été définitivement endommagé. Des données ont été perdues et les entreprises sur Internet ont été ébranlées. Au plus fort de l'incendie, 3,6 millions de sites Internet correspondant à 464 000 noms de domaine étaient indisponibles.

Personne n'a été blessé. Mais, en termes de propriété, il s’agit de la plus grande catastrophe jamais survenue dans un centre de données. Jamais auparavant ou depuis, un centre de données complet n’a brûlé.

Le secteur existe pour fournir un stockage fiable des données et est fier de préparer en détail chaque catastrophe susceptible de survenir. Les centres de données ne tombent pas en panne. Mais celui-ci a fait plus que cela, il s’est complètement autodétruit.

Il est clair que quelque chose a vraiment mal tourné au SBG2.

Silence étrange

Dans d’autres secteurs, nous saurions ce qui s’est passé. Lorsque des avions s’écrasent, les enregistreurs de vol « boîtes noires » racontent l’histoire. Lorsque les entreprises font faillite, les juricomptables reconstituent le processus en détail.

Contrairement à cela, le secteur des centres de données, fier de la précision de ses opérations, est resté silencieux sur SBG2.

Trois ans plus tard, il n'y a pas de récit officiel de ses dernières heures. OVHcloud a déblayé les décombres, construit un nouveau data center sur le site et ignoré toute demande d'information à ce sujet. Au lendemain de l'incendie, des centaines de clients d'OVHcloud ont menacé de porter plainte. Pourtant, en trois ans, Data Center Dynamics n'a connaissance que de deux clients ayant saisi les tribunaux. Tous deux ont reçu une indemnisation, mais aucun n’a encore reçu d’argent, car les cas font l’objet d’un appel.

Ce secret ne surprendra pas les utilisateurs des centres de données. Dissimuler les échecs est une pratique normale et, comme les observateurs du secteur l’ont souligné à maintes reprises, c’est une très mauvaise pratique, car cela signifie que la même chose se reproduira très probablement.

Les pannes des centres de données sont souvent des « pannes récurrentes », a déclaré le consultant Ed Ansett d'i3 Solutions à Data Center Dynamics en 2017. Ansett a été consulté sur les incidents de panne des centres de données depuis des années et nous a dit que beaucoup d'entre eux ont les mêmes causes profondes. Les échecs sont masqués par des accords de non-divulgation et les erreurs se répètent.

"Je suis arrivé à la conclusion il y a quelque temps que les gens n'apprenaient pas de l'expérience", a déclaré Ansett.

Quelques jours après qu'une panne dans un centre de données de British Airways ait immobilisé des milliers de vols, Ansett et ses collègues ont annoncé DCIRN, un service de « rapport d'accident » permettant de partager les données sur les incidents du centre de données, d'apprendre de ses erreurs et d'éviter les répétitions.

Dans les jours qui ont suivi l'incendie de SBG2, Ansett et son collègue du DCIRN, Dennis Cronin, ont partagé des listes d'incendies de centres de données et ont exprimé l'espoir que cet incendie serait peut-être celui qui persuaderait l'industrie des centres de données de s'ouvrir.

Trois ans plus tard, cet espoir a été déçu. L'incendie de SBG2 n'a jamais été entièrement expliqué. Et le DCIRN lui-même a été dissous en août 2021. « Nous n'avons pas réussi à attirer de sponsors, nous avons donc suspendu l'initiative », nous a déclaré Ansett en 2021, à l'occasion du premier anniversaire de l'incendie du SBG2.

Malgré cela, nous pouvons rassembler de nombreux faits sur l’incendie. Et ils ne rendent pas la lecture confortable.

Qu’est-ce qu’OVHcloud ?

Mais d’abord, pourquoi devrions-nous nous soucier d’OVHcloud ? Comme son nom l'indique, il fonctionne dans le cloud et présente certaines similitudes avec le leader du marché AWS (Amazon Web Services). Elle possède désormais des installations aux États-Unis, à Singapour, en Australie et en Inde, mais elle présente un caractère très différent des autres acteurs du cloud.

Elle est à une échelle beaucoup plus petite, elle est basée en Europe, avec son siège à Paris, et elle a fait à chaque étape ses propres choix d'ingénierie, en en parlant ouvertement.

OVH a été fondée en 1999 par Octave Klaba, étudiant en informatique de 24 ans à l'université Icam de Lille, qui a repéré la demande d'hébergement Internet et a emprunté environ 3 000 dollars (25 000 francs dans la monnaie française d'avant l'euro).

La famille de Klaba avait émigré de Pologne vers la France après la chute du mur de Berlin ; ses parents Henryk et Halina ont contribué aux prêts et son frère Miroslav s'est joint à l'initiative. L'entreprise a commencé avec des serveurs loués dans un centre de données parisien, mais a rapidement pris son propre espace de 3 000 m² à Paris en 2003, avant de s'étendre dans un site industriel abandonné à Roubaix, au nord-ouest de Paris en 2005.

OVH s'est concentré sur la construction en interne. Dès 2001, Klaba fabriquait des boîtiers et des châssis ainsi que des serveurs internes « GreenBox ». En 2003, il a ajouté sa propre conception de système de refroidissement par eau.

Lorsqu'OVH s'est installé dans le complexe de Roubaix, Henryk Klaba dirigeait un atelier de métallurgie pour fabriquer les boîtiers et les racks d'OVH, en utilisant une conception de rack horizontal unique dans l'industrie. Celui-ci était encore en activité en 2019, lors de la visite du Data Center Dynamics.

Les racks refroidis par liquide de l'entreprise exigent moins des refroidisseurs du bâtiment, de sorte que l'entreprise a pu se développer au coup par coup dans le dédale d'usines désaffectées de Roubaix, plutôt que de construire de nouvelles installations de haute technologie.

Mais en 2012, l'entreprise s'agrandit avec un nouveau centre de données au Canada, et sa première installation sur le site de Strasbourg. À cette époque, OVH était fier d'annoncer EcoRoom, une conception de centre de données qui supprimait la climatisation au profit d'un « système de ventilation naturelle utilisant un flux d'air chaud et froid ».

Nous reviendrons sur cet aspect.

Durant cette période, OVH était une société d'hébergement de geeks, avec des clients geeks. Ils adoraient voir Klaba jouer avec des musiciens sur scène lors du spectacle annuel de l'entreprise. OVHcloud a attiré quelques clients majeurs, mais avait également la réputation de soutenir le secteur le plus anarchique du secteur, notamment les joueurs, les sociétés de cryptomonnaie et les bons et mauvais pirates informatiques. Vers 2010, le site Wikileaks de Julian Assange y a élu domicile.

Ce qui s'est passé?

Malgré le secret, nous en savons beaucoup sur l'incendie. Une centaine de pompiers, avec 44 véhicules de lutte contre les incendies, ont mis six heures pour maîtriser l'incendie. Au plus fort de l'incendie, les pompiers français de Strasbourg ont fait appel à un bateau-pompe franco-allemand opérant sur le Rhin.

Nous savons que l'incendie s'est déclaré dans la salle des onduleurs. L'eau pourrait être en cause, ainsi qu'un grand nombre de batteries destinées à fournir une alimentation continue en cas de panne du réseau. C’est ce qui s’est produit dans les premiers jours qui ont suivi le début de l’incendie.

Un an après l’incendie, le rapport des pompiers du Bas-Rhin est publié. Il a ensuite été retiré d'Internet, mais pas avant que les commentateurs n'aient remarqué des détails choquants, dont beaucoup ont été confirmés par une enquête du Bureau d'enquête et d'analyse des risques industriels (BEA-RI).

Les pompiers sont arrivés sur place une minute avant 1 heure du matin. Ils ont découvert des arcs électriques de plus d’un mètre de long autour de la porte de la salle électrique. "Les éclairs étaient impressionnants et les bruits assourdissants", indique leur rapport.

Le rapport ultérieur du BEA-RI a eu accès à des images de vidéosurveillance et à des données de capteurs qui montraient le moment où l'incendie s'est déclaré dans la salle électrique. Il a également noté des relevés d'humidité élevés à proximité de l'un des onduleurs dans une salle électrique au cours de l'heure précédant le début de l'incendie.

Les pompiers ont pu voir suffisamment pour savoir qu'il s'agissait d'un incendie d'origine électrique. La première chose qu’ils ont essayé de faire a été de couper l’alimentation électrique du bâtiment, mais cela s’est avéré plus compliqué qu’il n’y paraît.

A 1h13, les pompiers tentent de couper l'alimentation électrique, mais l'électricité continue de circuler. À 1h30 du matin, ils ont demandé au service public local de couper l’électricité en amont, mais l’électricité est toujours entrée dans le bâtiment au moins jusqu’à 2h14 du matin, et jusqu’à 3h28 du matin, selon le rapport des pompiers.

Le rapport du BEA-RI ajoute quelques détails. Comme de nombreux centres de données, SBG2 disposait d'une alimentation de secours basée sur un ensemble de générateurs diesel conçus pour démarrer automatiquement en cas de coupure du réseau. Lorsque le service public a coupé le courant, les systèmes de contrôle des moteurs diesel les ont rallumés, même si le bâtiment était en feu.

Cela signifie que les serveurs de certains clients d’OVH fonctionnaient encore alors que le bâtiment était en feu.

Le retard dans la coupure de courant a éloigné les pompiers de la salle électrique et a laissé le temps aux flammes de se propager. La salle électrique avait un plafond en bois conçu pour résister au feu pendant une heure et les conduits électriques n'étaient pas isolés. Vers 1h30, le feu avait atteint le reste du bâtiment.

L'incendie n'a apparemment été gêné par aucun système de gicleurs ni par d'autres mesures de prévention des incendies, et s'est accéléré dans le bâtiment principal, doté de planchers et de plafonds en bois.

Vers 2h14, SBG2 était « totalement embrasé » et les pompiers ont réorienté leurs efforts pour empêcher la propagation du feu à SBG1, qui a échappé de peu à une destruction totale.

La conception « EcoRoom » de SBG2 visait à créer un flux d’air à travers le bâtiment. Lorsque l’incendie s’est déclaré, ce flux d’air s’est transformé en cheminée et le bâtiment est devenu un enfer.

Ce type de conception peut sembler bizarre, mais EcoRoom était un produit de la culture technologique d’OVHcloud, née de l’accent mis sur le coût, la rapidité et l’efficacité, qui a évolué sur le site.

Les premières installations d'OVH à Strasbourg, SBG1 et SBG4, avaient été construites à la hâte à partir de conteneurs maritimes et ne disposaient pas des fonctionnalités de redondance standards. Cela a entraîné une grave panne en 2017, qui a mis hors service les services d'OVH, mais n'a pas endommagé les bâtiments.

SBG2 était une installation EcoRoom, utilisant l'idée du refroidissement « gratuit », laissant la chaleur perdue des serveurs s'élever hors du bâtiment et aspirant l'air frais de l'extérieur.

OVHcloud n'avait apparemment pas réalisé que cela risquait de propager un incendie qui s'établirait dans le bâtiment. L’entreprise ignorait également apparemment les multiples dangers constatés par les pompiers.

Pivoter vers le silence

Dans les premiers jours qui ont suivi l'incendie, Octave Klaba était le geek sérieux et adorable qu'il avait toujours été. Il était sur place pour le nettoyage, tweetant, publiant des vidéos et promettant un soutien et une transparence totale.

Le 11 mars, il a publié une vidéo contenant des détails intéressants sur la façon dont l’incendie aurait pu se déclencher. Lorsque les pompiers sont arrivés, a-t-il déclaré, leurs caméras thermiques ont montré que deux onduleurs (UPS7 et UPS8) étaient en feu. C'était intéressant, car UPS7 avait fait l'objet d'une maintenance la veille du début de l'incendie.

Le rapport du BEA-RI fera ultérieurement état de quelques travaux de maintenance : les onduleurs de la salle électrique 2 avaient nécessité une attention particulière en raison de « problèmes récurrents de passage en mode bypass » et « inexpliqués ».

Dans sa vidéo du lendemain de l'incendie, Klaba a déclaré : "Le fournisseur est venu et a changé beaucoup de pièces à l'intérieur de l'UPS7, et ils l'ont redémarré dans l'après-midi. Il semblait que cela fonctionnait, mais le matin, nous avons eu l'incendie."

Au cours des semaines suivantes, Klaba a tweeté des détails sur les efforts de l'entreprise pour nettoyer les serveurs, récupérer les données et redémarrer SBG2 et les autres installations du site, qui avaient toutes été fermées. Les serveurs ont été transportés à Roubaix pour être nettoyés et les racks des SBG1, SBG3 et SBG4 ont été mis sous tension un par un.

Le mardi 16 mars 2021, moins d'une semaine après l'incendie, OVHcloud a remis du matériel électrique aux enquêteurs de la police.

Klaba considérait l’incident comme un défi technologique mais les clients ne voyaient pas tous les choses de la même manière. Beaucoup pensaient avoir payé pour un service fiable avec des sauvegardes et étaient choqués par la perte de leurs données.

Klaba a promis qu'à l'avenir tous les clients bénéficieraient de sauvegardes gratuites par défaut, et a promis un grand changement : "Je pense que cet incident va changer les normes de l'industrie", a-t-il déclaré.

Il a également déclaré qu'il en révélerait la cause plus tard dans la semaine, le vendredi 19 mars.

Aucune de ces promesses ne s’est réalisée.

Vendredi, un deuxième petit incendie a eu lieu dans la salle des batteries du SBG1 endommagé. Au cours du week-end, OVHcloud a abandonné ses efforts pour redémarrer cette installation paralysée – et Klaba a commencé à se taire.

Le fondateur d'OVHcloud a continué de tweeter les détails du retour progressif des services depuis Strasbourg. Un affichage en direct sur le site de l’entreprise a montré que les serveurs reprenaient vie.

Mais il a arrêté de parler de l'incendie et a commencé à faire des promesses sur l'avenir, notamment un projet de création d'un laboratoire pour diriger la recherche industrielle sur la prévention des incendies dans les centres de données.

Le changement semble avoir été motivé par son PDG. Les tweets et vidéos de Klaba parlaient de plus en plus de décisions prises « avec Michel [Paulin] ».

vivien

  • Administrateur
  • *
  • Messages: 48 042
    • Twitter LaFibre.info
Les conséquences : un bourbier juridique

Le changement d'attitude s'est précisé un mois après l'incendie, lorsqu'OVHcloud a publié ses offres d'indemnisation pour les clients concernés.

Pour beaucoup, ce fut une déception. OVHcloud proposait des remboursements pour la perte de service, plutôt qu'une compensation pour les pertes commerciales. Les clients n'étaient même pas indemnisés pour les données perdues, à moins qu'ils n'aient payé pour les sauvegardes, la société affirmant que les clients du cloud devraient gérer leurs propres plans de reprise après sinistre.

Les clients disposant de serveurs privés virtuels ont obtenu un remboursement pour les mois pendant lesquels le service n'était pas disponible. Si le serveur avait été détruit, ils disposaient de six mois supplémentaires, et si les données étaient perdues… eh bien, cela dépendait du fait qu'ils avaient ou non payé OVHcloud pour les sauvegardes.

Les clients plus importants bénéficieraient d'un plan plus personnalisé, car ils devraient reconstruire ou migrer leurs services à partir de tout serveur pouvant être redémarré. Klaba était toujours pratique et accessible à ces personnes, tweetant : "Nous avons créé le processus de migration incluant la copie des PB de données de SBG vers RBX. Cela va vite mais nous devons parler avec chaque client, envoyez-moi un message privé. "

Cela n’a pas satisfait tout le monde. Un certain nombre de personnes ont poursuivi OVHcloud pour négligence et le cabinet d'avocats parisien Ziegler Associates a commencé à rassembler des noms pour un recours collectif - une procédure inhabituelle qui n'a été introduite que récemment dans le droit français.

Ce recours collectif semble n’avoir jamais été intenté. Ziegler a été en contact régulier avec Data Center Dynamics en 2022 alors que le nombre de plaignants est passé à 140, réclamant un total de 10 millions d'euros.

En juin 2022, Ziegler a déclaré à Data Center Dynamics qu'il avait une lettre officielle prête à envoyer à OVHcloud, comme début d'un processus de négociation. OVHcloud n'a jamais accusé réception de la lettre, et Ziegler comme OVHcloud ont cessé de répondre à nos questions en juillet 2022.

Le recours collectif Ziegler, qui peut ou non avoir été réglé en secret, était fondé sur une négligence en matière de protection contre les incendies, ce qui semblait être révélé par le rapport des pompiers. Avant de cesser de répondre à nos questions, OVHcloud a déclaré que ce rapport n'était pas valable, car les pompiers ne comprenaient pas les datacenters. Il a promis que son propre rapport donnerait une explication plus complète, mais ce rapport n’a jamais été publié.

Pendant ce temps, jusqu'à quatre entreprises poursuivaient individuellement OVHcloud pour une question légèrement différente. Il s'agissait d'entreprises qui pensaient qu'OVHcloud avait sauvegardé leurs données en toute sécurité, mais les avaient quand même perdues.

Deux de ces affaires ont été portées devant les tribunaux en 2022 et OVHcloud a perdu les deux. Le verdict du tribunal était totalement accablant sur sa procédure de sauvegarde.

Les plaignants, Bati Courtage et Bluepad, avaient tous deux payé un supplément à OVHcloud pour sauvegarder leurs données en toute sécurité, mais ont appris après l'incendie que l'entreprise ne l'avait pas fait. Les copies de sauvegarde de leurs données se trouvaient dans le même centre de données que les serveurs actifs, et toutes deux ont été perdues dans l'incendie.

Le tribunal de commerce de Lille Métropole a jugé en février 2023 que cela ne répondait pas aux promesses de service d'OVHcloud et l'a condamné à verser respectivement 100 000 € et 150 000 € à Bati Courtage et Bluepad.

Lorsqu’il est apparu que la sauvegarde de la foncière Bati Courtage avait été perdue, les représentants d’OVHcloud ont tenté d’argumenter que conserver une sauvegarde dans la même pièce que les données primaires était parfaitement acceptable, dans la lettre de leur contrat de sauvegarde. Cet argument a été rejeté par le juge, qui a souligné que le fournisseur de services disposait de nombreux autres centres de données pour conserver les sauvegardes.

Le cas de l’éditeur de logiciels SaaS Bluepad était un peu différent. L'entreprise a payé à OVHcloud des serveurs supplémentaires et a effectué ses propres sauvegardes. Bluepad avait accès à la console de gestion d'OVHcloud, qui indiquait que ses données principales se trouvaient dans SBG1 et que la sauvegarde était dans SBG2.

Après l'incendie, Bluepad a été choqué de découvrir que la console mentait. Les deux serveurs étaient dans SBG2 et tous deux étaient morts. OVHcloud a fait valoir que les informations de la console n'étaient qu'une indication, mais le juge l'a rejeté.

OVHcloud a-t-il menti ou été incompétent sur les données de Bluepad ? Nous ne le savons pas, mais nous savons encore une chose. Les données auraient pu être sauvegardées, car OVHcloud a récupéré dans l'épave un disque dur Bluepad en bon état. Les données étaient toujours là, jusqu'à ce qu'OVHcloud rompe ses propres procédures et allume le disque, auquel cas il s'est formaté tout seul et les données ont été perdues.

Un an plus tard, ces découvertes n’en ont pas conduit à d’autres. OVHcloud a fait appel et l'affaire est à nouveau devant la justice. Les résultats sont scellés jusqu'à ce que l'appel soit entendu. Data Center Dynamics s’est entretenu avec des avocats français qui préviennent que le système judiciaire du pays pourrait mettre beaucoup de temps à régler définitivement ces cas, sans parler des autres.

Un contact français a déclaré à Data Center Dynamics : « En France, les délais de justice sont très longs ».

Les commentateurs soupçonnent que le processus a été délibérément bloqué, par respect pour le statut d’OVHcloud en tant que champion national, qui a bénéficié d’un large soutien de la part du gouvernement français dans le passé.


OVHcloud et Klaba rebondissent

Pendant ce temps, OVHcloud semble avoir continué à ne pas être affecté par la catastrophe. L’année 2021 s’est terminée par une introduction en bourse réussie qui a permis de lever quelque 350 millions d’euros (380 millions de dollars) et de valoriser l’entreprise à bien plus de 4 milliards d’euros (4,36 milliards de dollars).

En 2022, cependant, l’entreprise a enregistré une perte en raison des retombées de l’incendie.

La valeur de l’entreprise est depuis retombée à environ 2 milliards d’euros (2,18 milliards de dollars), mais son rôle de champion européen est plus que jamais rentable. En 2022, elle bénéficiait d'un prêt de 200 millions d'euros (218 millions de dollars) de la Banque européenne d'investissement.

Elle a continué à construire de nouveaux centres de données, dont une nouvelle installation (et espérons-le ignifuge) sur le site de SBG2.
2019_DEC_FR_ROUBAIX_IMAGE_0185_BD
Dans un data hall OVHcloud. L'entreprise continue de se développer. – OVHcloud

SBG5 est le premier nouveau data center OVHcloud basé sur un nouveau design destiné à éviter une répétition de la catastrophe SBG2. Le bâtiment dispose de 1 700 m² (18 300 pieds carrés) d’espace de centre de données répartis en 19 pièces isolées séparées par des murs en maçonnerie qui « offrent une résistance au feu jusqu’à deux heures ».

OVHcloud affirme également disposer d'un système d'extinction d'incendie à gaz et a construit les sept salles d'énergie et les trois salles de batteries du data center à l'extérieur du bâtiment.

L'entreprise a suivi les tendances du secteur en proposant un service de formation en IA et en hébergeant un ordinateur quantique du cabinet de conseil informatique français Atos.

Malgré l'échec technique de SBG2, l'entreprise a peaufiné ses références en matière de technologie de centre de données, en présentant une nouvelle évolution de son système de refroidissement liquide, qui enferme les serveurs individuels dans leurs propres réservoirs d'immersion, traversés par des tuyaux connectés au système de refroidissement par eau existant. .

Octave Klaba est toujours visible sur tous les événements d'OVHcloud. Mais même après l'introduction en bourse, la famille Klaba possède environ 70 pour cent de l'entreprise et Octave a dépensé une partie de son argent en tant qu'entrepreneur ailleurs.

Même avant l'incendie, Klaba était en train d'acheter la société de jeux Blade, qui exploitait le service de jeux en nuage Shadow. Il a ajouté un service de stockage de style Dropbox à Shadow.

En 2023, il rachète un moteur de recherche français, Qwant, et commence à faire de grandioses promesses. Tout comme OVHcloud veut devenir un AWS européen, Klaba a déclaré lors d'entretiens qu'il pourrait faire de Qwant un Google européen.

En 2023, Qwant avait dépensé 50 millions d’euros de fonds publics et était à bout de souffle. Klaba l'a acheté et l'a fusionné dans une nouvelle société SaaS appelée « Synfonium » qui, a-t-il promis, associera service pour service de Google, à la technologie européenne.

Ni OVHcloud ni Klaba ne parleront de l'incendie de SBG2 pour le moment, mais ils utilisent tous deux l'expérience de manière surprenante, après avoir vu que les champions nationaux bénéficient d'un traitement de faveur.

Les informations semblent montrer qu’OVHcloud gère un centre de données dangereux et peu fiable, et le regarde s’enflammer. Ce n'est pas repentant. Au contraire, elle est fière d’elle-même, présentant SBG5 comme le dernier mot en matière de résilience, née des connaissances qu’elle a acquises.

OVHcloud sait que la France est prête à pardonner et à oublier commodément les échecs de ses entreprises les plus importantes. Cet effet a été constaté avec un autre leader français de la technologie, la société de services Atos.

Il semble qu’OVHcloud et Klaba aient retenu une leçon : être un champion européen de la technologie vous rend à l’épreuve du feu.

Data Center Dynamics a contacté OVH pour cette pièce, mais n'a reçu aucune réponse.


Source : Data Center Dynamics du 28 mars 2024, rédigé par Peter Judge et traduit de l'anglais.

butler_fr

  • Client Bbox adsl
  • Modérateur
  • *
  • Messages: 3 588
  • FTTH orange
je trouve l'article un peu à charge.
Il y a pleins de chose tout à fait vrai par contre elles ne sont jamais remise en contexte.

sauvegarder entre sbg1 et sbg2 (même si au final l'indication était trompeuse avec une distinction entre zone cloud public et datacenter floue), n'aurait pas permis d'éviter un soucis sachant que certains serveurs de sbg1 ont brulés / d'autres partiellement récupérables / .... Au mieux ça aurait permis de remonter une sauvegarde plusieurs semaine / mois après.

dans tous les domaines tu indemnise le service que tu as fourni, pas le chiffre d'affaire lié à ce service. Attendre autre chose hormis en justice est irréaliste.

la fin de l'article laisse à passer qu'ils sont presque déçus qu'ovh ne se soient pas planté après cet incendie...
qu'elle société saine d'esprit s'auto flagèlerait en disant ne venez pas chez nous on est des gros nazs regardez on construits de nouveaux datacenter différents parce que ceux d'avants étaient pourraves.

Citer
la France est prête à pardonner et à oublier commodément les échecs de ses entreprises les plus importantes

waouh grand moment de journalisme ^^
OVH n'est pas la première et certainement pas la dernière à bénéficier de ça.
ça marche comme ça partout dans le monde et pour des faute bien plus graves (coucou boeing) et faire le contraire serait simplement du pur masochisme

vivien

  • Administrateur
  • *
  • Messages: 48 042
    • Twitter LaFibre.info
OVH a beaucoup travaillé pour sécuriser ses datacenter, on est passé d'un mauvais élève à un très bon élève.

Comme quand il y a un incident ou un accident, le nécessaire est fait pour que cela ne puisse plus se reproduire.

Par contre, contrairement à d'autres secteurs, OVH a arrêté de communiquer sur ces sujets et n'a pas partagé avec ses concurrents (comme c'est le cas dans l'aviation).

On a des informations avec les documents publics pour certaines autorités, mais OVH n'a pas fait de document complet visant à établir les causes et indiquant tout ce qu'il a fait ensuite.


J'ai visité (dans le cadre de mon travail, donc pas de photo), plusieurs datacenter d'OVH il y a un peu plus d'un an, je peux vous dire que c'est impressionnant le travail réalisé sur les dernières générations de datacentre.

Les salles batteries sont de petits bâtiments à l'extérieur, isolés de tout. Les onduleurs ont aussi été extraits du datacenter (ils ne sont pas avec les batteries, mais dans un autre bâtiment).

On est très loin de tout ce qui a été montré sur ce forum par les post d'Octave Klaba.
Visiblement, ils comptent avant tout sur les humains pour éteindre un éventuel incendie, contrairement à tous les datacenters classiques.

Il y a un avant SBG2 et un après SBG2, chez OVH, mais chez tous les acteurs. On peut regretter que certains (Maxnod) n'aient pas pris en considération le peu d'information qui a été communiqué sur cet incendie.

Je sais que certains sont sceptiques sur les murs coupe-feu 2h. L'incendie Global Switch Clichy du 26 avril 2023 est plutôt positif : incendie incontrôlable de batteries au Lithium suite à une fuite d'eau et le datacenter n'a pas été coupé. Seul le client de l'étage (Google) a été coupé et si Google a mal géré la coupure, c'est un sujet distinct, indépendant de la gestion de l'incendie par Global Switch.

On pourra remarquer que Global Switch Clichy est encore pire que OVH coté retour d'expérience. Si on a eu des infos, c'est à cause de l'imapct Google. Le client aurait été une banque avec une redondance totale dans un autre DC, on n'aurait rien eu comme info.