Auteur Sujet: OVH - incident majeur du au watercooling  (Lu 22462 fois)

0 Membres et 1 Invité sur ce sujet

tcardonne

  • Abonné Bbox fibre
  • *
  • Messages: 6
    • @tcardonne
OVH - incident majeur du au watercooling
« Réponse #12 le: 02 juillet 2017 à 20:45:44 »
Est-ce de l'eau du robinet ou un liquide adapté qui ne conduit pas l'électricité ? ;D

Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 5 971
OVH - incident majeur du au watercooling
« Réponse #13 le: 02 juillet 2017 à 20:48:39 »
C'est clairement de l'eau du robinet, avec des additifs pour éviter le développement des bactéries et autres microorganismes.

Leon.

111

  • Abonné Orange Fibre
  • *
  • Messages: 235
  • Nantes
OVH - incident majeur du au watercooling
« Réponse #14 le: 02 juillet 2017 à 21:02:09 »
Je me suis toujours demandé comment le système de watercooling artisanal pouvait fonctionner correctement tellement ça avait l'air rudimentaire, personnellement ça ne m'inspire pas confiance ...

vivien

  • Administrateur
  • *
  • Messages: 47 088
    • Twitter LaFibre.info
OVH - incident majeur du au watercooling
« Réponse #15 le: 02 juillet 2017 à 21:02:59 »
Dans les datacenter Google, une hypothèse sur les faux-plancher était de pouvoir éviter en cas de fuite de mouiller le matériel :

Cliquer sur la photo pour zoomer :


Moi, il y a un truc que je ne comprends pas.

Pourquoi ils mettent des faux planchers? On voit bien sur plein de photos que les clims (échangeurs) sont directement au plafond des "allées chaudes".

Donc il est peu probable que les faux planchers soient choisis pour la circulation de l'air. Pour les chemins de câble non plus, puisqu'on voit que tout est en hauteur: alimentation électrique, et fibre. Circulation d'eau? Si oui, c'est vraiment étrange. s'embêter à mettre des faux planchers juste pour ça, ça ne me parait pas logique.

Leon.

Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 5 971
OVH - incident majeur du au watercooling
« Réponse #16 le: 03 juillet 2017 à 21:40:07 »
Dans les datacenter Google, une hypothèse sur les faux-plancher était de pouvoir éviter en cas de fuite de mouiller le matériel :
C'est clair que c'est assez probable comme hypothèse : pouvoir maintenir le réseau d'eau froide sans mettre en péril les installations.

Et là, chez Google, on voit de vrais raccords industriels, pas comme chez OVH.

Leon.

vivien

  • Administrateur
  • *
  • Messages: 47 088
    • Twitter LaFibre.info
OVH - incident majeur du au watercooling
« Réponse #17 le: 03 juillet 2017 à 21:53:19 »
C'est une baie de 96 disques EMC qui a été impactée. Elle alimentait pas moins de 97 serveurs SQL !

Ces 97 serveurs SQL étaient utilisés par 50.000 sites Web (dont plusieurs sites de e-commerce, indisponibles pour le lancement des soldes).
Bref, je suis étonné du nombre de serveurs SQL qui sont sur un même filer, sachant que ce ne sont pas des serveurs SQL qui se tournent les pouces.

Il y a probablement des centaines de serveurs web pour héberger les sites et des dizaines ou centaines de baies disques pour le contenu des sites hors de la base de donnée.

Bref c'est une quantité impressionnante de matériel qui reposent sur un seul filer.
Je me demande a quelle vitesse il faut changer les 96 disques SSD de cette baie qui reçoivent en permanence des grosses écritures.

Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 5 971
OVH - incident majeur du au watercooling
« Réponse #18 le: 03 juillet 2017 à 22:29:54 »
Vivien, il faut bien voir ce que c'est un filer EMC : C'est pas un bête serveur de fichier classique.
C'est un système constitué de plusieurs têtes (serveurs), tous les éléments sont équipés d'alim redondantes, toutes les liaisons sont redondées, les switches aussi, etc...
C'est conçu pour résister à une panne de n'importe lequel de ses éléments.
Un peu comme les équipements télécom haute disponibilité.
Bref, c'est du lourd, c'est fait pour tourner H24, c'est hyper fiable, y compris d'un point de vue logiciel. Tout est maintenable à chaud.

Mais effectivement, pour des serveurs de bases de donnée, avec énormèment d'IOPS, il est peut-être plus judicieux de n'avoir que des serveurs avec disques dur locaux, je ne sais pas. Mettre des bases de données sur un SAN, je sais que ça se fait, mais je ne sais pas si c'est avantageux.

Leon.

underground78

  • Expert
  • Abonné Free fibre
  • *
  • Messages: 7 434
  • Orsay (91)
    • FreePON : suivi géographique du déploiement fibre EPON chez Free
OVH - incident majeur du au watercooling
« Réponse #19 le: 03 juillet 2017 à 22:43:21 »
Oles a promis sur Twitter de publier un post-mortem pour que les gens puissent voir si ou non OVH n'a pas été très franc dans sa comm au sujet de l'incident.

Mieszko

  • Expert.
  • Abonné Bbox fibre
  • *
  • Messages: 244
  • Wambrechies 59
OVH - incident majeur du au watercooling
« Réponse #20 le: 03 juillet 2017 à 23:30:11 »
un vnx ne fonctionne pas sous l'eau, tout comme une bonne partie des équipements informatique.
Parole de tech EMC ;) (je bosse chez DELL/EMC, je maintiens une grosse partie de la gamme de produits dont le VNX).

Par ailleurs, j'ai eu quelques infos sur l'incident, et effectivement, il semblerait que ca soit lié a de l'eau.
Attendons les explications post mortem de Octave Klaba.

Un truc qui m'a bien fait rigoler, c'est l'article de zdnet, la dernière phrase.
Je pense qu'il y a du avoir un échange entre OVH et EMC quand a cette communication a charge, mais de la à mettre la pression sur un client pour changer de version ... j'en doute.
C'est tjrs plus facile de mettre en cause un fournisseur/constructeur que de se remettre en cause a cause de son infrastructure.

Anonyme

  • Invité
OVH - incident majeur du au watercooling
« Réponse #21 le: 03 juillet 2017 à 23:52:14 »
C'est tjrs plus facile de mettre en cause un fournisseur/constructeur que de se remettre en cause a cause de son infrastructure.
La bonne réputation se forge dans la transparence, les erreurs sont compréhensibles.
Le monde est petit,tout le monde se connais et c'est la crédibilité de chacun qui est en jeux dans ce type de comportement.

Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 5 971
OVH - incident majeur du au watercooling
« Réponse #22 le: 04 juillet 2017 à 06:40:14 »
La bonne réputation se forge dans la transparence, les erreurs sont compréhensibles.
Le monde est petit,tout le monde se connais et c'est la crédibilité de chacun qui est en jeux dans ce type de comportement.
Je ne suis pas forcèment d'accord avec toi. On doit impérativement mettre des limites à la transparence.
Dans la majorité des cas, un fournisseur de service ne doit pas parler de ses dysfonctionnements internes auprès de ses clients. C'est juste risqué.

Là, je pense clairement que OVH va souvent trop loin dans la transparence, maitrise mal sa communication, et ça fait du tort à l'entreprise. On apprend plein de choses pas glorieuses du tout à cause de leur communication :
* sur Hubic, OVH nous a parlé de dysfonctionnements internes
* sur la non validation de Over The Box (ce sont les clients qui valident),
* sur le watercooling pas joli à voir,
* sur les mise à jour catastrophiques des routeurs en journée,
* sur l'absence de redondance de la plupart des onduleurs (1 onduleur HS = des milliers de serveurs HS pendant 24h)
* etc...
Mais bon, c'est la marque de fabrique de cette boite.

La réputation d'un fournisseur de service (hébergeur ou autre), c'est avant tout son service client, sa réactivité, en plus de la qualité, du rapport qualité/prix, etc...

A l'extrême, ça ne me choquerai pas si OVH ne nous avait jamais parlé du watercooling, alors qu'ils en font massivement. D'ailleurs, il est tout à fait possible que d'autres hébergeurs moins transparent le fassent mais sans en parler! 

Leon.

tivoli

  • Toulouse (31)
  • Abonné Bbox fibre
  • *
  • Messages: 1 944
  • Toulouse (31)
OVH - incident majeur du au watercooling
« Réponse #23 le: 04 juillet 2017 à 06:55:39 »
La force ou l'intelligence d'une baie EMC c'est le cache, ce qui explique surement comment les SSD ne lachent pas (souvent).