ça reste du OVH .. On n'apprend pas grand chose.
La procédure d’urgence, servant à exécuter cette série d’opérations existait et avait été testée. Mais pas industrialisée. Autrement dit, restaurer une table à partir du backup est trivial. Restaurer un très grand volume de tables, initialement réparties sur 99 VM, nécessitait davantage d’automatisation, sans quoi la restauration aurait nécessité plusieurs journées.
Moi ce qui me choque le plus c'est qu'ils n'aient pas prévu de devoir restaurer des milliers de bases de données d'un coup. Ils en ont des milliers par serveur donc il était prévisible que des milliers tombent d'un coup ..
C'est comme l'alerte Audio qui ne marchait pas juste ce jour là. ça peut être vrai, mais c'est souvent juste le jour de la MAJ foireuse qu'il y a un incident. Bon d'accord, si il n'y avait pas eu un incident aussi grave, on en aurait pas parlé .. Mais ça vaudrait le coup de mieux tester le système audio avant de le release.
Sinon un truc qui me parait long,
Après avoir sollicité l’aide du constructeur de la baie peu après 20 h, les équipes poursuivent les tentatives de rallumer la baie, sans succès. 20 minutes après son démarrage, elle s’éteint sous l’effet d’un mécanisme de sécurité.
ça ne vous parait pas long 20 minutes pour que le système de sécurité s'enclenche pour une fuite d'eau ? J'ai envie de penser que soit il y a court circuit => arrêt immédiat, soit si elle est sous tension depuis 19 minutes, elle peut continuer ...à moins que ça ne soit les disques durs qui aient pris l'eau / ait cramé et qu'au bout de 20 minutes la baie se met en défaut car elle ne retrouve pas les informations lui permettant de lire les données ..
Nb : j'ai été impacté à titre perso, mais rien de bien grave. (juste une indisponibilité d'environ 20 H, je n'ai pas perdu de CA ou autre comme certains.)
Pour le prix que je paye (moins cher que tous les autres), j'accepte ce "problème".