Auteur Sujet: Serveur Dell R330: Arret pour surcharge sans raison  (Lu 6976 fois)

0 Membres et 1 Invité sur ce sujet

Taboin

  • Abonné Free fibre
  • *
  • Messages: 164
  • Technicien informatique | AS207536 | Aube (10)
    • mon site o/
Serveur Dell R330: Arret pour surcharge sans raison
« Réponse #12 le: 09 novembre 2019 à 11:56:33 »
Hey !

J’ai de temps en temps un serveur dell au boulot qui as ce genre d’erreur, il est équipé de 2 alimentations de 750W et des fois il affiche un pic de plus de 14kW de consommé   :o

Mais juste un seul pic et souvent la nuit, donc le lendemain on arrive et on voit ça dans les mails, on se demande ce que le serveur a fumé pendant la nuit  ;D
C’est un bug de la carte IDRAC ou des alimentations car nos onduleurs n’ont rapporté aucun pic sur la consommation pendant la nuit

vivien

  • Administrateur
  • *
  • Messages: 47 213
    • Twitter LaFibre.info
Serveur Dell R330: Arret pour surcharge sans raison
« Réponse #13 le: 11 novembre 2019 à 21:30:28 »
J'ai décidé de mettre à jour le serveur concerné puis de réinitialiser la partie "Historique des pics" pour voir si cela résout le problème.

Quelques copies d'écran des versions avant la mise à jour, si cela peut être utile à Dell :



Les log qui permettent de voir tout l'historique sur les maintenances des voies A et B d'Interxion 2 Paris :




Historique des températures de l'air en entrée du serveur :


vivien

  • Administrateur
  • *
  • Messages: 47 213
    • Twitter LaFibre.info
Serveur Dell R330: Arret pour surcharge sans raison
« Réponse #14 le: 11 novembre 2019 à 21:31:58 »
Les 3 mises à jour poussées (je ne tente pas la mise à jour des power supply) :


Seulement deux job en attente de reboot !?


Mais après 18 minutes de mises à jour au reboot, tout est ok :


vivien

  • Administrateur
  • *
  • Messages: 47 213
    • Twitter LaFibre.info
Serveur Dell R330: Arret pour surcharge sans raison
« Réponse #15 le: 11 novembre 2019 à 21:36:49 »
Un peu hors sujet, mais je voulais suivre le vieillissement des SSD après près de deux ans d'hébergement des archives Ubuntu.

Je ne vois qu'un indicateur global "Endurance d'écriture évaluée restante" :



J'espérais avoir dans les détails les indicateurs Smart habituels avec par exemple le nombre de To écrit sur chaque disque... mais non, Dell ne remonte pas à l’utilisateur ces informations alors que ce sont des SSD de marque Intel.


Les autres menus :




vivien

  • Administrateur
  • *
  • Messages: 47 213
    • Twitter LaFibre.info
Serveur Dell R330: Arret pour surcharge sans raison
« Réponse #16 le: 12 janvier 2020 à 11:55:58 »
Suite à ces problème, j'ai déclenché un incident chez Dell.

Ils ont cherchés, cherchés, via une prise de contrôle à distance de l'iDrac, pas mal de chose a été vérifiées mais finalement, la réponse étant que les mises à jour faites devraient corriger, même si ce n'est pas dans le changelog.

Sur le serveur qui s'était arrêté au reboot avec un "The system halted because system power exceeds capacity" pas de problème, l'historique des pics de watts et d’ampères sont corrects :



vivien

  • Administrateur
  • *
  • Messages: 47 213
    • Twitter LaFibre.info
Serveur Dell R330: Arret pour surcharge sans raison
« Réponse #17 le: 12 janvier 2020 à 11:57:50 »
Voici un autre serveur Dell PowerEdge R330, avec un hardware et version micro logiciel identique (seul différence il a juste plus de disques).

Je suis étonné de ce "Pic de watts consommés de 2617 w" !

Il est équipé de deux blocs d'alimentation 350 watts (puissance max de sortie) / 432 watts (puissance max d'entrée) :

Sur l'autre serveur, celui qui a un pic e 2617 watts, un serveur qui a été commandé en même temps eu les mêmes mises à jour, l'historique des pics de watts est ok, mais pas le pic d’ampères : 3,3 A est visiblement une donnée erronée au vu du pic de 82 watts qui lui semble pertinent.



La seule hypothèse était une perte ou un retour d'alimentation aux mêmes dates et heure, mais ce n'est pas le cas :


J'ai mis à jour le BIOS en version 2.8.1, version publiée il y a deux jours et qui apporte les modifications suivantes, mais je pense qu'il y a epu de chance que cela améliore les erreur de mesure de la consommation.


This release contains BIOS firmware version 2.8.1 for Dell PowerEdge R330/R230/T330/T130.
Enhanced BIOS security protection features.

Fixes
- None for this release.

Enhancements
- Enhancement to address the security vulnerabilities (Common Vulnerabilities and Exposures) such as CVE-2019-0117, CVE-2019-0123, CVE-2019-0124, CVE-2019-0151, CVE-2019-0184, CVE-2019-0185 and CVE-2019-11090.
- Updated Intel processor and memory reference codes to production version (PV) post launch release 5 (PLR5) Hotfix 2 v4.1.1.2.
- Updated the Intel Server Platform Services (SPS) and Manageability Engine (ME) firmware to production release SPS_E3_04.01.04.088.
- Updated the microcode of the following Intel processors to version 0xC6:
Intel Xeon Processor E3-1200 v6 Product Family
Intel Core Processor i3-7000 Product Family
Intel Pentium Processor G4600 Product Family
Intel Celeron Processor G3930 Product Family
- Updated the microcode of the following Intel processors to version 0xD4:
Intel Xeon Processor E3-1200 v5 Product Family
Intel Core Processor i3-6000 Product Family
Intel Pentium Processor G4400 or G4500 Product Family
Intel Celeron Processor G3900 Product Family
- Updated Intel TXT SINIT AC Module to version 1.7.4 and BIOS AC Module to version 1.6.0.