Auteur Sujet: Canicule: risque "très élevé" pour les datacenters  (Lu 38066 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #96 le: 25 juillet 2019 à 18:27:19 »
OVH a fait des tweets, mais rien sur la canicule.

On trouve quand même des graphes : (OVH Gravelines)


Et il y a mention de la température dans certains tickets d'incidents :


Temps de résolution estimé 15 minutes ! (il est 18h30)

K-L

  • Abonné SFR THD (câble)
  • *
  • Messages: 4 651
  • HFC 100 Mbs / FTTH 1Gbs sur Oullins (69)
    • Cable Rhone
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #97 le: 25 juillet 2019 à 18:59:26 »
Cet évènement assez majeur (et appelé à se reproduire dans les années à venir) va forcèment permettre à tous ceux qui ont été impactés de réaliser des retours d'exploitation sur leur gestion de la situation et y apporter des solutions (nouvelles ou non) pour pouvoir encaisser ce même genre d'aléa à l'avenir.

Par exemple, à Lille, je viens de lire que le réseau câblé de SFR connaît des soucis alors que dans le Rhône ou l'on a déjà atteint les 40°, le réseau a tenu car déjà adapté à ces températures.

Optix

  • AS41114 - Expert OrneTHD
  • Abonné Orne THD
  • *
  • Messages: 4 644
  • WOOHOO !
    • OrneTHD
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #98 le: 25 juillet 2019 à 19:05:57 »
Tiens OVH a des souci de température ? Je pensais que le watercooling résistait à tout  ::)

Par exemple, à Lille, je viens de lire que le réseau câblé de SFR connaît des soucis alors que dans le Rhône ou l'on a déjà atteint les 40°, le réseau a tenu car déjà adapté à ces températures.
+1, mes noeuds optiques ont tenu aussi.  8)

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #99 le: 25 juillet 2019 à 19:08:46 »
Coté Firstheberg, il y a moins de casse que prévue :


vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #100 le: 25 juillet 2019 à 19:15:38 »
Certains n'hésitent pas a communiquer que tout s'est bien passé, alors que la température dépasse le 40°c, alors que d'autres sont en alerte jusqu’à minuit (Interxion) :


Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 5 971
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #101 le: 25 juillet 2019 à 19:28:02 »
Bon, vu le nombre de problèmes chez OVH, je crois qu'ils vont regretter la pub qu'ils ont tenté de faire il y a tout juste 1 mois...
https://www.usinenouvelle.com/article/comment-ovh-evite-le-coup-de-chaud-a-ses-datacenters.N859570

Pour moi, il y a un énorme problème avec le watercooling OVH : même si 70% de la "chaleur" est dissipée par l'eau, ils semblent ne pas s'occuper réellement de l'air! Apparemment, aucun moyen n'est prévu pour rafraichir l'air... C'est du délire!

La combinaison de climatisation plus watercooling, ça leur permettrait d'être infiniment plus résistant aux fortes chaleurs, tout en continuant à économiser beaucoup d'argent par rapport à un système "tout clim".
Quitte à n'utiliser la clim que lorsque l'air extérieur est vraiment chaud (plus de 25°C).
Surtout que tous les équipements ont besoin de températures raisonables pour fonctionner de la manière la plus fiable possible, pas seulement les processeurs des serveurs!

Et même si personne ne doutait de la fiabilité du système de refroidissement adiabatique de Scaleway-Online DC5, un grand bravo à eux!

Leon.

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #102 le: 25 juillet 2019 à 19:30:47 »
C'est clair que je préfère ceux qui communiquent sur un risque, quitte a ce que tout se passe bien, alors que OVH on n'a pas d'infos a part les clients mécontent.

Difficile de se faire une idée de ce qu'il s'est passé...

Certains incidents sont tardifs :


D'autres sont long a se résoudre : (tweet à 19h04 pour une panne à 14h30)




vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #103 le: 25 juillet 2019 à 19:53:27 »
Enfin on n'a pas parlé de Scaleway DC2.

Le serveur https://k-net.testdebit.info/ (dans la baie K-Net) est un PowerEdge R210, il n'a pas de sonde de température pour l'air qui rentre dans le serveurs, mais vu la température de son CPU, on voit bien que tout s'est bien passé :



A priori sur DC3 la température a été stable toute la journée.

caaptusss

  • AS197922 Officiel Techcréa
  • Expert
  • *
  • Messages: 115
  • Valenciennes (59)
    • FirstHeberg
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #104 le: 25 juillet 2019 à 20:06:00 »
Quelques infos en vrac sur comment on vit la chose de notre coté :
Notre salle 1 a tenu une température stable à 23°c toute la journée, je suis impressionné par l'efficacité des groupes Daikin et LG, mais on a 40% de capacité disponible en froid dans la salle, ça aide beaucoup.
Notre salle 2 a tenu toute la journée sans panne, la température est en "plat" sur le graphique depuis 30mn, ça devrait recommencer à baisser tranquillement d'ici une grosse demie heure.
En salle 3, la clim ne fait que 8kW pour 25kW de conso. Le reste, c'est de l'aspiration à très haut volume de l'air du couloir chaud (de 80cm de large) vers l'extérieur. On y apporte également de l'air extérieur en équivalence. On aspire 8000 M3/h dans la salle, ça souffle bien, du coup, même si la clim est toujours à fond, on a une circulation de l'air très acceptable.
Il a donc fait en toute logique 42°c dans la salle cet après midi en couloir "froid" et près de 60°c en couloir chaud. La clim venant souffler l'air froid qu'elle produit devant les baies critiques.
On a eu que 2 filers et un host qui sont tombés sur plus de 600 machines, et on constate depuis 30mn que la température baisse, en équivalence à l'extérieur.

Bref, c'était chaud patate, mais ça a tenu.
Coté POP télécom, on en a 2 ou on a une baie qui n'est pas climatisée, juste un gros extracteur d'air. Et je vous confirme que c'était tendu à certains moments mais ça a tenu. Disons qu'il faut pas que ça dure 1 semaine complète car l'accumulation de chaleur dans ces espaces se cumule jours après jours, mettant en péril le bon fonctionnement des onduleurs par exemple.
J'essayerais de vous sortir quelques graphiques définitifs quand tout sera terminé ce week end.

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #105 le: 25 juillet 2019 à 20:24:42 »
Merci pour le retour.

Je dois dire que tu m'a fait bien peur, avec Arnaud.

Le message où tu explique avoir le matin même déménagé des serveurs dans un autre datacenter pour gagner que Kw de chaleur :
Ce matin, on a éteint toutes les machines non loués et pas déjà mise en veille, et on a déménagé une dizaine de lames dans un datacenter voisin dans lequel on a un peu de capacité. Mais les équipes ont pour ordre d'éteindre les serveurs si les clims ont une casse ou mise en sécurité. Du moins, si les groupes mobiles ne parviennent pas à maintenir une situation opérationnelle.

+ le risque "très élevé" associé au bandeau rouge sur l'espace client Scaleway...


Vous avez bien prévenus vos clients et vous n'avez pas eu d'incident trop grave.

Au contraire, d'autres datacenter semblent avoir eu de gros soucis, mais ils ne communiquent qu'avez leurs clients.

Leonix est un peu dans la même situation que toi : les clim doivent être changées. Hier c'était déjà très chaud. Hugues comment s'est passé la journée ?[/size]


underground78

  • Expert
  • Abonné Free fibre
  • *
  • Messages: 7 434
  • Orsay (91)
    • FreePON : suivi géographique du déploiement fibre EPON chez Free
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #106 le: 25 juillet 2019 à 23:10:20 »
Je demanderais comment ça s'est passé chez nous mais ça n'avait l'air de n'inquiéter personne. Je crois qu'on a pas mal de marge niveau clim.

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Canicule 2019: risque "très élevé" pour les datacenters
« Réponse #107 le: 25 juillet 2019 à 23:40:13 »
La suite des courbes pour le serveur de test de de débit Bouygues Telecom de Lyon :

Température de l'air en degrés d’entrée (vert) / sortie (bleu). (40°c correspond au seuil d’alerte pour l'entrée d'air)


Température du CPU (vert) / PCH (bleu). Le PCH (Platform Controller Hub) est un chipset Intel sur la carte mère.


Température du SSD :


Vitesse des 8 ventilateurs du serveur (en tours par minute): Les ventilateurs des deux alimentations ne sont pas remontés.


Consommation électrique du serveur Dell R330 (en Watts):
Je suis étonné par l'augmentation de la consommation alors que la charge est stable.

La donnée est remontée avec des paliers de 14 watts. [/size]