Auteur Sujet: Un Masterpact FirstHeberg explose suite à une erreur humaine (Lu 63732 fois)

mattmatt73 · « **Réponse #12 le:** 09 avril 2018 à 12:20:47 »

Citation de: Jojo78 le 09 avril 2018 à 12:10:13

Sans aucune connaissance du domaine, j'avais un peu la même pensée.

et avec la connaissance du domaine ?

172sp · « **Réponse #13 le:** 09 avril 2018 à 12:31:20 »

Il faut prendre en compte la probabilité d'accident, la couverture des assurance et les coûts engendrés.
Dans ce cas on imagine bien que c'est l'assureur du sous traitant qui va probablement payer les coûts engendrés, car il n'y a pas que le remplacement du matos, il y a aussi les indemnités pour les clients qui avait des GTR très petites.

vivien · « **Réponse #14 le:** 09 avril 2018 à 13:42:27 »

Tout est un ratio entre les risques et les couts...

L'accident nucléaire de Fukushima est là pour nous rappeler que certaines coupures électriques peuvent avoir des conséquences très importantes.

30 secondes avant les secousses principales, la centrale a été éteinte par sécurité. Le séisme est inférieur aux hypothèses de dimensionnement et il n'y à ce moment là aucun problème, excepté les six lignes d’alimentations électriques externes des réacteurs qui sont coupées. Cinquante-et-une minutes plus tard, le tsunami inondait 8 des 12 groupes électrogènes de secours à moteur diesel qui avaient pris le relais pour faire fonctionner les pompes de refroidissement. Un système d'ultime secours sur batterie à pris le relais, puis s'est arrêté par défaillance des batteries électriques. La centrale n'avait pas de système prévu pour raccorder en urgence des groupes externes et les groupes acheminés en urgence le jour même n'ont pas pu être connectés. On connait la suite. L'électricité sera rétabli une semaine après, trop tard.

mattmatt73 · « **Réponse #15 le:** 09 avril 2018 à 13:51:36 »

Citation de: vivien le 09 avril 2018 à 13:42:27

Tout est un ratio entre les risques et les couts...

mais on est d'accord que ça parait stupide de protéger un DC à l'eau ?

vivien · « **Réponse #16 le:** 09 avril 2018 à 14:04:27 »

OVH le fait, je ne pense pas qu'ils soient stupides.

=> OVH et la protection incendie

Leon avait fait la remarque :

Citation de: Leon le 11 avril 2013 à 19:32:52

Ce sont de simples sprinkler qui arrosent avec de l'eau. Ca n'a rien à voir avec les systèmes de brumisation très haute pression, où l'eau s'évapore instantannèment, et qui permettent de sauver les serveurs. Ici, ça arrose, et tous les serveurs sont morts. C'est conçu comme ça. Etonnant, non?

L'extinction incendie n'est pas obligatoire comme l'évoque Arnaud d'Online :

Citation de: abermingham le 15 avril 2013 à 10:44:16

En France, les datacenters sont règlementés essentiellement par le code du travail, par les préconisations ICPE (à autorisation ou déclaration) et par les assureurs.
Au niveau purement règlementaire, les seules choses qui sont demandées c'est :
- Le désenfumage mécanique ou naturel pour les locaux aveugles ou faisant plus de 300m2
- Le compartimentage coupe-feu au delà d'un certain volume / m2
- Des issues de secours accessibles avec une certaine largeur
- Une ventilation donnant un minimum d'air neuf par occupant
- L'accessibilité pompier par la facade pour les locaux sont le plancher bas du dernier niveau est à plus de 8 mètres
- 1 chiotte pour 10 personnes (occupant un poste considéré comme "fixe")

Rien n'est demandé ni en détection incendie, ni en extinction. C'est très léger.

172sp · « **Réponse #17 le:** 09 avril 2018 à 17:59:38 »

Il est bon de rappeler qu'un sprinkler ne s'enclenche uniquement en cas de température trop élevée, donc au moment de son déclenchement, le matos à proximité est déjà bien entamé par le feu et probablement irrécupérable.

renaud07 · « **Réponse #18 le:** 10 avril 2018 à 15:58:06 »

Impressionnant... C'est là qu'il est bon de se rappeler les dangers de l'électricité...

caaptusss · « **Réponse #19 le:** 14 avril 2018 à 00:52:44 »

Ca a été un moment particulièrement pénible, vous pouvez me croire ...
L'utilisation de 2 groupes câblés en TWIN nous a sauvé la mise sur la fin des interventions, car le sous-traitant ne maitrisait pas du tout le concept de disponibilité 100 %.

On a perdu plusieurs dizaines de serveurs, de disques (hdd ou ssd), d'alimentations et même des CPU... Les pannes étaient surtout regroupées sur une baie dont l'onduleur a lui aussi rendu l'âme. On suppose qu'il y a eu une bonne surtension sur le réseau au moment de l'arc, ou des harmoniques vraiment badasse.
Les gars dans notre équipe ont tous super bien réagit et ont fait front ensemble face à ce désastre, ça fait vraiment plaisir à voir ! Le plan Blackout a été suivi à la lettre par l'équipe, avec extinction au plus rapide de tous les systèmes critiques en priorité, puis extinction des serveurs. On lance aussi un petit script qui backup et sauvegarde les conf de tout le réseau en quelques secondes tant que les onduleurs sont encore allumés. Tout a fonctionné de ce coté là et quand le jus est revenu, on a pu redémarrer en 30mn pour 50 % des infras, et 1h30 pour 95 %. Vu le nombre de machines (plusieurs milliers), c'est honnête.

Par contre, je vous dis pas le pic de courant au démarrage... Certaines machines avaient un uptime aussi vieux que la construction de la salle. Par exemple sur la salle 1, on était pas loin de 6 ans ...

vivien · « **Réponse #20 le:** 14 avril 2018 à 07:47:02 »

Comment un jeu de barre peut permettre de relier une phase au neutre ? Cela un intérêt dans certains cas ?

Ce type de manipulation ne devrait pas être impossible ?

Citation de: caaptusss le 14 avril 2018 à 00:52:44

Par contre, je vous dis pas le pic de courant au démarrage...

Je me suis demandé pourquoi Dell et d'autres fabricants ne configurent pas l'UEFI par défaut pour ne démarrer qu’après un temps aléatoire (entre 0 et 240sec), pour éviter aux baies chargées de disjoncter lors de la remise sous tension.

C'est une option qui est présente, mais qui n'est pas activée par défaut.

mattmatt73 · « **Réponse #21 le:** 14 avril 2018 à 08:12:31 »

Citation de: vivien le 14 avril 2018 à 07:47:02

Comment un jeu de barre peut permettre de relier une phase au neutre ? Cela un intérêt dans certains cas ?

Dans certains cas oui, tu couples ensemble les 3 phases + neutre et le tout va à la terre.

Ça permet d'intervenir en sécurité sur des systèmes et de mettre un site en mode isolé quand tu sais que tes alims vont prendre la foudre.

C'est ce qu'ils se passe sur les gros sites èmetteurs TNT/FM où la foudre arrive souvent.

Quand une sonde d'ionisation ou que météo France déclare le site comme probablement foudroyé dans pas longtemps, démarrage groupe, monté en charge, bascule de sources, isolation de l'extérieur et prières pour pouvoir retrouver l'alimentation extérieure après.

Groumph · « **Réponse #22 le:** 17 avril 2018 à 21:18:46 »

Bonsoir, je ~~déterre~~ réponds pour signaler que c'est "Masterpact", pas "Masterpack". Je vous aime quand même

Très intéressant en tout cas. Un régime TN-C ? Le genre d'accident qui fait frémir tous ceux qui ont déjà monté un jeu de barres... C'est joli avant mise en service

Hugues · « **Réponse #23 le:** 17 avril 2018 à 21:41:41 »

Tout le monde dit Masterpack, même les opérateurs de DC, donc les deux sont acceptables

Auteur Sujet: Un Masterpact FirstHeberg explose suite à une erreur humaine (Lu 63732 fois)

mattmatt73

Un masterPack FirstHeberg explose suite à une erreur humaine

172sp

Un masterPack FirstHeberg explose suite à une erreur humaine

vivien

Un masterPack FirstHeberg explose suite à une erreur humaine

mattmatt73

Un masterPack FirstHeberg explose suite à une erreur humaine

vivien

Un masterPack FirstHeberg explose suite à une erreur humaine

172sp

Un masterPack FirstHeberg explose suite à une erreur humaine

renaud07

Un masterPack FirstHeberg explose suite à une erreur humaine

caaptusss

Un masterPack FirstHeberg explose suite à une erreur humaine

vivien

Un masterPack FirstHeberg explose suite à une erreur humaine

mattmatt73

Un masterPack FirstHeberg explose suite à une erreur humaine

Groumph

Un masterPack FirstHeberg explose suite à une erreur humaine

Hugues

Un masterPack FirstHeberg explose suite à une erreur humaine