Auteur Sujet: load average du serveur lafibre.info : +2 (causes de I/O inconnues)  (Lu 11488 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 168
    • Twitter LaFibre.info
load average du serveur lafibre.info : +2 (causes de I/O inconnues)
« Réponse #24 le: 18 septembre 2016 à 13:03:32 »
Je vais effectivement passer sur un noyau plus récent (Ubuntu 14.04 propose maintenant le noyau Linux 4.4 issue d'Ubuntu 16.04).

Je vais demander à Lionel (Adeli/Maxnod) de re-connecter le DRAC (niveau sécurité, je trouvas pas ca top qu'il soit sur une IP publique et si le DRAC se fit hacker, ils ont un accès local au serveur) ce qui va me permettre de faire le hard reboot nécessaire.

jack

  • Professionnel des télécoms
  • *
  • Messages: 1 676
  • La Madeleine (59)
load average du serveur lafibre.info : +2 (causes de I/O inconnues)
« Réponse #25 le: 18 septembre 2016 à 13:24:09 »
Même en SIGKILL (je crois que c'est le nom) ça les tue pas ?

Sinon, le noyau doit avoir un soucis, il faudrait en essayer un autre.
Les "threads" noyaux sont insensibles aux signaux

Ce n'est pas nécessaire un bug logiciel, l'aspect défectueux du matériel n'est pas à mettre de côté
Ceci dit, peut-être que des "workarounds" sont disponibles dans une nouvelle version .. :)

Citer
Sans garantie de succès, mais tu peux peut-être essayer de forcer le déchargement du module associé au pilote USB, avant de le recharger.
Il est impossible de décharger un module en cours d'utilisation

seb

  • Pau Broadband Country (64)
  • Abonné SFR fibre FttH
  • *
  • Messages: 515
  • FTTH 1 Gbps sur Pau (64)
load average du serveur lafibre.info : +2 (causes de I/O inconnues)
« Réponse #26 le: 18 septembre 2016 à 14:20:55 »
Il est impossible de décharger un module en cours d'utilisation
L'option -f de la commande rmmod est pourtant censée le permettre:
RMMOD(8)                             rmmod                            RMMOD(8)

NAME
       rmmod - Simple program to remove a module from the Linux Kernel

SYNOPSIS
       rmmod [-f] [-s] [-v] [modulename]

(...)
       -f, --force
           This option can be extremely dangerous: it has no effect unless
           CONFIG_MODULE_FORCE_UNLOAD was set when the kernel was compiled.
           With this option, you can remove modules which are being used, or
           which are not designed to be removed, or have been marked as unsafe
           (see lsmod(8)).

Et l'option CONFIG_MODULE_FORCE_UNLOAD dont il est question est active par défaut sur le noyau Debian :
seb@gaston:~$ grep CONFIG_MODULE_FORCE_UNLOAD /boot/config-$(uname -r)
CONFIG_MODULE_FORCE_UNLOAD=y

S'il n'y a rien d'autre que l'interface RAC du serveur qui utilise la pile USB, ça ne craint pas grand chose d'essayer.

Je vais demander à Lionel (Adeli/Maxnod) de re-connecter le DRAC (niveau sécurité, je trouvas pas ca top qu'il soit sur une IP publique et si le DRAC se fit hacker, ils ont un accès local au serveur) ce qui va me permettre de faire le hard reboot nécessaire.
Tu n'as pas accès à IPMI ?
root@dom0:~# ipmitool power
chassis power Commands: status, on, off, cycle, reset, diag, soft

Après si c'est juste un 'hard reboot' du système que tu cherches à réaliser, pas besoin du RAC :
echo 1 > /proc/sys/kernel/sysrq
echo b > /proc/sysrq-trigger
Évidemment, tu ne lances ça qu'après avoir arrêté les services et démonté les systèmes de fichiers qui peuvent l'être.

Accessoirement, si les processus scotchés en état D influent sur la charge du système, ils ne consomment techniquement aucune ressource.
« Modifié: 18 septembre 2016 à 15:13:17 par seb »

vivien

  • Administrateur
  • *
  • Messages: 47 168
    • Twitter LaFibre.info
load average du serveur lafibre.info : +2 (causes de I/O inconnues)
« Réponse #27 le: 24 octobre 2016 à 18:32:34 »
Lionel (Adeli) a fait un hard reboot du serveur (après avoir déclenché une extinction propre du serveur via le bouton on en face avant)

=> J'ai immédiatement migré sur un Kernel 4.4, j’espère que le bug du dirver USB qui se plante ne se reproduira pas.