Merci beaucoup Arnaud (@online_fr) pour tous ces détails. C'est très intéressant.
Un hébergeur, comme Scaleway-Online qui est fier de montrer ouvertement ses installations (y compris aux journées portes ouvertes), effectivement, ça inspire confiance.
Par rapport au rapprochement que fait Vivien avec Fukushima... Même si le rapprochement est un peu hasardeux, je pense qu'un des point vitaux est la formation du personnel présent H24 sur site à toutes les procédures d'urgence.
Une formation répétée à toutes ces procédures, c'est juste indispensable. Je pense qu'Arnaud peut facilement faire le rapprochement avec ses formations de pilote amateur d'avion léger.
L'aviation de ligne, avec le nucléaire, c'est des domaines où ce type de formation régulière est le plus présent et le plus judicieux.
Rendre l'installation complexe (datacenter) facilement compréhensible (c'est un métier), et former continuellement les équipes, c'est une des clefs essentielles à la gestion de ce genre de problèmes. J'insiste sur la formation
continuelle. Pour agir efficacement dans l'urgence, on n'a pas le temps de puiser dans sa mémoire des informations qui n'ont pas été ravivées depuis des années.
Plusieurs exemples montrent que la gestion d'incident aurait pu être différente avec des équipes terrain plus formées
* Fukushima, effectivement
*
Telehouse 2 perte de climatisation, avec une manipulation malheureuse d'une vanne inappropriée
* et peut-être
la perte d'alimentation Online DC2, où l'opérateur sur site aurait pu déclencher manuellement les groupes récalcitrants en acquittant les alarmes.
* etc...
Du coup, est-ce que certains opérateurs de datacenter mettent en place des formations spécifiques? Et aussi des simulateurs d'infrastructure, sur lesquelles l'opérateur peut s'entrainer? Comme un simulateur d'avion, ou un simulateur de salle de commande de centrale nucléaire?
Les équipes terrain se forment auprès des équipementiers (SDMO, Eaton, etc...) ?
Leon.