Auteur Sujet: OVH - incident majeur du au watercooling  (Lu 22460 fois)

0 Membres et 3 Invités sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 086
    • Twitter LaFibre.info
OVH - incident majeur du au watercooling
« Réponse #24 le: 04 juillet 2017 à 08:55:06 »
(je bosse chez DELL/EMC, je maintiens une grosse partie de la gamme de produits dont le VNX).

Un SSD, même dans la gamme professionnelle, lâche après quelques milliers de To écrit :
Endurance sur de gros fichiers :

Malgré quelques baisse de régimes, le Samsung 840 Pro reste supérieur à ses concurrents (crédit : TechReport)

Endurance sur des petits fichiers :

Sur les petits fichiers, le Samsung 840 Pro tient toujours la dragée haute aux autres, tandis que le Kingston HyperX 3K Comp est à la peine (crédit : TechReport).

Ca serait possible de savoir l'endurance sur les produits EMC ?
Les SSD doivent avoir du spare, mais avec les solicitations, j'ai un peu de mal à comprendre comment les disques peuvent rester plusieurs années.

Hugues

  • AS2027 MilkyWan
  • Modérateur
  • *
  • Messages: 12 425
  • Lyon (69) / St-Bernard (01)
    • Twitter
OVH - incident majeur du au watercooling
« Réponse #25 le: 04 juillet 2017 à 08:56:33 »
@vivien : Généralement, une BDD web, c'est surtout beaucoup de lecture, ça peut te donner une piste :)

vivien

  • Administrateur
  • *
  • Messages: 47 086
    • Twitter LaFibre.info
OVH - incident majeur du au watercooling
« Réponse #26 le: 04 juillet 2017 à 09:29:08 »
Oui majoritairement en lecture, mais je vois quand même de nombreuses écritures pour LaFibre.info

Par exemple chaque pages lu, tu vas mettre à jour des compteurs de visite (devant chaque sujet vous pouvez voir le nombre de vue et il y a une section stats : https://lafibre.info/stats/ )

Pour ceux qui sont connectés, les visites entraient encore plus d'écriture.

De plus les lectures sont presque toutes en cache ( la base de données tient en ram) alors que les écritures doivent se faire au fil de l'eau pour limiter la casse en cas de panne.

tivoli

  • Toulouse (31)
  • Abonné Bbox fibre
  • *
  • Messages: 1 944
  • Toulouse (31)
OVH - incident majeur du au watercooling
« Réponse #27 le: 04 juillet 2017 à 09:36:28 »
Une baie EMC a son propre "onduleur" pour ecrire les infos du cache meme en cas de panne.


miky01

  • Expert. Réseau RESO-LIAin (01)
  • Abonné K-Net
  • *
  • Messages: 3 829
  • Farges (01)
OVH - incident majeur du au watercooling
« Réponse #28 le: 04 juillet 2017 à 11:54:19 »
Les bays de storages pro, HP, HDS, ont toutes leurs propres batteries pour faire un shutdown propre en cas de panne complète d'alim, ce qui arrive jamais comme c'est alimenté avec des sources redondantes et les PS sont aussi N+1 , mais apparemment des clients ont pas tous compris le principe du "high availabillity"....

Et pour le cas de OVH, mis a part ce systeme "watercooling" digne d'un bricolage avec des flexibles en plasic mou, quand on héberge des comptes Premium / Pro, la moindre des chose est d'avoir 2 bays redondantes, et pas dans la meme salle, voir sur 2 sites différents pour les clients tres critiques comme les banques, pharma, et autres.

Maintenant tout est es une question de cout, et si OVH arrive a des prix tres bas, ca se paye avec la fiabilité qui est pas a niveau.

Hugues

  • AS2027 MilkyWan
  • Modérateur
  • *
  • Messages: 12 425
  • Lyon (69) / St-Bernard (01)
    • Twitter
OVH - incident majeur du au watercooling
« Réponse #29 le: 04 juillet 2017 à 12:27:56 »
On parle du mutu la, pas de trucs critiques ;-)

Leon

  • Client SFR sur réseau Numericable
  • Modérateur
  • *
  • Messages: 5 971
OVH - incident majeur du au watercooling
« Réponse #30 le: 04 juillet 2017 à 13:22:28 »
On parle du mutu la, pas de trucs critiques ;-)
Sauf du pas critique mutiplié par des dizaines de milliers, ça devient critique!
Donc OK, un serveur qui impacte 10 sites mutualisés, ça n'est pas critique.
Mais un serveur qui est capable de faire tomber 10 000 sites mutualisés, c'est archi critique!

C'est comme en télécom : une carte de DSLAM qui tombe (100 clients), ça n'est pas dramatique. Mais un gros NRA complet qui tombe (10 000 clients), là, c'est critique!

Leon.

Kaelhan

  • Abonné Orange Fibre
  • *
  • Messages: 466
  • Toulouse (31)
OVH - incident majeur du au watercooling
« Réponse #31 le: 04 juillet 2017 à 13:41:58 »
Les questions que doivent se poser les clients tournent autour du contrat de service qu'ils ont signé avec Ovh.
Délai de remise en route, sauvegarde-restauration, sécurisation sur plusieurs sites ou non etc ...
Cela ne remet pas en cause la qualité de la baie de stockage EMC² et les technologies associées, ce n'est que de la technique (si je veux être provocateur)

Si ovh a annoncé la couleur par rapport à leurs engagements de servuce à ce sujet alors tout est clair....ensuite il est vrai que le watercooling fait assez "cheap"  :D

Mieszko

  • Expert.
  • Abonné Bbox fibre
  • *
  • Messages: 244
  • Wambrechies 59
OVH - incident majeur du au watercooling
« Réponse #32 le: 04 juillet 2017 à 13:50:37 »
Un SSD, même dans la gamme professionnelle, lâche après quelques milliers de To écrit :
Ca serait possible de savoir l'endurance sur les produits EMC ?
Les SSD doivent avoir du spare, mais avec les solicitations, j'ai un peu de mal à comprendre comment les disques peuvent rester plusieurs années.

Je n'ai pas de chiffres a communiquer, mais de mon expérience sur le terrain, je remplace peu de SSD (et ce, sur n'importe quel type de machine baie middle range full flash comme baie highend full flash (vmax 3 pour pas le citer).
D'une manière générale, je remarque que sur un parc installé assez vaste, j'ai moins de pannes de disques (mecaniques ou ssd) qu'il y a quelques années.
On peut surement l'expliquer par une meilleur qualité des composants.

Il y a quelques années, j'ai bossé sur une grosse campagne de remplacement massifs de disques seagate qui étaient defectueux et avaient un fort risque de generer des doubles fautes dans un raidgroup (2 disques en faute dans le meme raidgroup, ca peut faire des degats). Je ne sais pas cbien on en a remplacé worldwilde, mais en France, on avait un sacré paquet de disques concernés (toutes capacités et vitesse confondues).

J'ai des VNX de 1ere génération installés chez des clients qui les utilisent depuis plusieurs années a 100% quasiment et ou je n'ai pas eu tant de disques a remplacer ou d'autres pièces. Ce type de machine est relativement fiable pour le peu qu'on ne leurs fassent pas prendre une douche. Sur les baies de stockages (que ca soit du file ou du block), on considère les disques comme des consommables, idem pour les SFP sur les switchs.

hwti

  • Abonné Orange Fibre
  • *
  • Messages: 2 237
  • Chambly (60)
OVH - incident majeur du au watercooling
« Réponse #33 le: 04 juillet 2017 à 22:09:27 »
Un SSD, même dans la gamme professionnelle, lâche après quelques milliers de To écrit :
Dans la liste, les "pro" sont des gammes intermédiaires, il y a d'autres gammes en théorie plus endurantes.
Avant c'était de la SLC, mais maintenant il doit y avoir de la MLC, officiellement triée pour avoir une meilleure endurance, et bien sûr il y a normalement beaucoup plus d'overprovisioning.

Chez Intel il y a la gamme DC, dont le modèle le plus endurant semble être https://www.intel.fr/content/www/fr/fr/products/memory-storage/solid-state-drives/data-center-ssds/dc-p3700-series/dc-p3700-2tb-aic-20nm.html : 62Po d'écritures, soit 17 écritures complètes de ses 2To chaque jour pendant les 5 ans de garantie.
En revanche, à 3,7€/Go, on est très loin des prix grand public.

vivien

  • Administrateur
  • *
  • Messages: 47 086
    • Twitter LaFibre.info
OVH - incident majeur du au watercooling
« Réponse #34 le: 04 juillet 2017 à 22:21:09 »
Un autre souci (quand j'ai cherché un SSD pour le serveur LaFibre.info) : Il n'est pas facile d'acheter un SSD de classe datacenter.

Les SSD sont vendu directement aux gros acteurs et impossible d'avoir les mêmes SSD que ceux utilisés par OVH ou Online.

Hugues

  • AS2027 MilkyWan
  • Modérateur
  • *
  • Messages: 12 425
  • Lyon (69) / St-Bernard (01)
    • Twitter
OVH - incident majeur du au watercooling
« Réponse #35 le: 04 juillet 2017 à 22:58:49 »
Au boulot on a pris des SSD Pro, ça marche relativement pas mal pour un Cluster Ceph