Auteur Sujet: MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum  (Lu 5144 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
J'ai prévu une grosse mis à jour logicielle du serveur lafibre.info demain mardi 21 septembre.

Aujourd'hui le serveur tourne avec Ubuntu server 16.04 LTS avec Ubuntu Advantage subscription pour avoir des mises à jour de sécurité.
Je vais mettre à jour vers Ubuntu server 18.04 LTS et enchaîner vers une mise à jour vers Ubuntu server 20.04 LTS.

Plusieurs interruptions de quelques minutes du forum se feront sentir pendant la journée.

mirtouf

  • Abonné Bbox fibre
  • *
  • Messages: 1 304
  • Chelles (77)
    • L'antre de la bête
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #1 le: 20 septembre 2021 à 18:00:09 »
Si le serveur ne repart pas, on saura pourquoi. :P

Optix

  • AS41114 - Expert OrneTHD
  • Abonné Orne THD
  • *
  • Messages: 4 667
  • WOOHOO !
    • OrneTHD
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #2 le: 20 septembre 2021 à 23:03:14 »
Je peux déjà sentir une vague de paquets ICMP qui va frapper ton serveur  ;D

Bon courage pour ces grosses mises à jour !

alain_p

  • Abonné Free fibre
  • *
  • Messages: 16 245
  • Delta S 10G-EPON sur Les Ulis (91)
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #3 le: 21 septembre 2021 à 08:40:22 »
Normalement, ces mises à jour se passent bien. Mais avec des upgrades de PHP, ou de base de données (Mysql ou MariaDB...), on peut s'attendre à quelques ajustements. En tout cas, merci d'avoir prévenu. Bon courage !
« Modifié: 21 septembre 2021 à 10:39:56 par alain_p »

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #4 le: 21 septembre 2021 à 12:19:58 »
J'ai prévu un plan B si cela tournait mal avec le serveur. Je pourrais relancer rapidement le forum depuis un autre serveur.

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #5 le: 21 septembre 2021 à 16:22:50 »
Mise à jour effectuée. Par contre de nombreux reboot seront nécessaire pour finaliser les évolutions.
J'ai pris l'habitude lors des mise à jour d'accepter de prendre les fichiers de configuration du mainteneur du paquet, en effet garder ses fichiers de configuration c'est perdre le risque d'un plantage si cela a bien évolué entre deux versions. Donc je fais remettre peu à peu mes modifications dans tout ce qui a été modifié par les mises à jour :
/etc/logrotate.d/dpkg
/etc/systemd/system.conf
/etc/apache2/apache2.conf
/etc/apache2/envvars
/etc/logrotate.d/apache2
/etc/mysql/mysql.conf.d/mysqld.cnf
/etc/ssh/sshd_config
/etc/munin/plugin-conf.d/munin-node
/etc/watchdog.conf
/etc/crontab

Sinon, plantage de SSH lors de la mise à jour Ubuntu 18.04 => 20.04, j'étais content d'avoir un KVM IP (permet d'intervenir à distance sur une machine comme si on était avec un clavier / écran local) qui ma permis de relancer le service SSH, puis de rattacher le "screen" de la mise à jour pour ne rien perdre.

testing5555

  • Abonné Bbox fibre
  • *
  • Messages: 550
  • Lyon 3 (69)
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #6 le: 21 septembre 2021 à 16:31:15 »
Sinon, plantage de SSH lors de la mise à jour Ubuntu 18.04 => 20.04, j'étais content d'avoir un KVM IP (permet d'intervenir à distance sur une machine comme si on était avec un clavier / écran local) qui ma permis de relancer le service SSH, puis de rattacher le "screen" de la mise à jour pour ne rien perdre.
L'installeur n'est pas sensé démarrer un deuxième serveur ssh sur un deuxième port pour pouvoir reprendre la main en cas de pépin ?
De mémoire le process d'upgrade indique ce second port à ouvrir dans le pare feu le temps de l'install avant de démarrer la mise à jour
Le KVM IP n'est pas toujours possible notamment sur les kimsufi (au moins sur les pas chers)

alain_p

  • Abonné Free fibre
  • *
  • Messages: 16 245
  • Delta S 10G-EPON sur Les Ulis (91)
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #7 le: 21 septembre 2021 à 16:45:26 »
Si effectivement. De mémoire, le port serait 1022 ?

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #8 le: 21 septembre 2021 à 16:57:51 »
Je confirme, le port 1022 était bien ouvert, mais impossible de se connecter (je n'ai pas relevé le message). C'est le même service SSH derrière.

Ce n'est pas systématique ce problème, j'ai déjà fais des mises à jour 18.04 => 20.04 sans avoir ce type de problème.

Ce serait lié à une attaque ? le port SSH était repassé sur le port 22 à cause de l’installation 16.04 => 18.04, je n'ai pas l'habitude d'avoir un port SSH ouvert comme ça sur le port 22.

La bonne solution quand on modifie le port SSH est de ne pas modifier /etc/ssh/sshd_config comme c'était le cas ici mais de créer un fichier spécifique avec les modifications apportées.

Exemple pour mettre SSH sur le port 222 et éviter les déconnexions du à un CG-Nat :
nano /etc/ssh/sshd_config.d/client_alive.conf
# Spécifie le port sur lequel le serveur écoute les connexions entrantes à la place du port par défaut 22
Port 222
# Forcer un échange toutes les 4 secondes, pour éviter la déconnexion derrière un NAT
ClientAliveInterval 4
ClientAliveCountMax 22

Je pense que ce type de configuration aurait évité le problème que j'ai rencontré.

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #9 le: 21 septembre 2021 à 18:04:21 »
Désolé pour la petite interruption du serveur, j'ai basculé Ubuntu 20.04 du kernel GA (5.4) vers le Kernel HWE (5.11 actuellement) et là plus de réseau.
cf Tutoriel pour comprendre et changer de noyaux Linux avec Ubuntu 20.04 LTS

En repassant en 5.4, le réseau est disponible. J'ai un peu de mal à comprendre.

Voici les info de dmes | grep bnx2 :

Noyau 5.4, le réseau est ok :
[    2.992331] bnx2: QLogic bnx2 Gigabit Ethernet Driver v2.2.6 (January 29, 2014)
[    3.040639] bnx2 0000:01:00.0 eth0: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c0000000, IRQ 16, node addr d4:ae:52:ce:c5:c7
[    3.107974] bnx2 0000:01:00.1 eth1: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c2000000, IRQ 17, node addr d4:ae:52:ce:c5:c8
[    3.259068] bnx2 0000:01:00.1 em2: renamed from eth1
[    3.352484] bnx2 0000:01:00.0 em1: renamed from eth0
[    7.277952] bnx2 0000:01:00.0 em1: using MSIX
[    8.329572] bnx2 0000:01:00.1 em2: using MSIX
[   10.341387] bnx2 0000:01:00.0 em1: NIC Copper Link is Up, 1000 Mbps full duplex
[   12.988454] bnx2 0000:01:00.1 em2: NIC Copper Link is Up, 1000 Mbps full duplex


Noyau 5.11, le réseau ne fonctionne pas car em1 et em2 sont introuvable :
[    2.947141] bnx2 0000:01:00.0 eth0: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c0000000, IRQ 16, node addr d4:ae:52:ce:c5:c7
[    2.978902] bnx2 0000:01:00.1 eth1: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c2000000, IRQ 17, node addr d4:ae:52:ce:c5:c8


Si vous avez une idée, je suis preneur. J'ai mis les dmesg complet ci-dessous :

Zweit

  • Abonné Free fibre
  • *
  • Messages: 238
  • Bieville-Beuville (14)
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #10 le: 21 septembre 2021 à 18:59:01 »
Salut,

[    2.947141] bnx2 0000:01:00.0 eth0: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c0000000, IRQ 16, node addr d4:ae:52:ce:c5:c7
[    2.977275] ACPI Warning: SystemIO range 0x0000000000000428-0x000000000000042F conflicts with OpRegion 0x0000000000000400-0x000000000000047F (\PMIO) (20201113/utaddress-204)
[    2.977284] hid: raw HID events driver (C) Jiri Kosina
[    2.978902] bnx2 0000:01:00.1 eth1: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c2000000, IRQ 17, node addr d4:ae:52:ce:c5:c8
[    3.002802] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
[    3.003153] ACPI Warning: SystemIO range 0x0000000000000540-0x000000000000054F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20201113/utaddress-204)
[    3.080085] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver

Pilotes incompatibles / manquants pour ce kernel ? Sur le net, je vois régulièrement ce problème associé à un paquet maquant. J'ai lu pour Ubuntu des résolutions avec linux-image-extra (ou linux-image-extra-`uname -r`) ou encore linux-modules-extra-.

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
MAJ du serveur mardi 21 septembre: il y a aura plusieurs interruptions du forum
« Réponse #11 le: 21 septembre 2021 à 19:15:31 »
Les messages SystemIO range conflicts with OpRegion sont liés à l'ACPI et me semblent sans lien avec le pb de réseau.

L'ACPI et le réseau étant initialisés simultanément.

Sur le kernel 5.4 avec le réseau ok, on a également ces erreurs ACPI. J'ai colorié pour que ce soit plus lisible :

[    2.938106] ACPI: watchdog: Skipping WDAT on this system because it uses RTC SRAM
[    2.952029] ACPI Warning: SystemIO range 0x0000000000000428-0x000000000000042F conflicts with OpRegion 0x0000000000000400-0x000000000000047F (\PMIO) (20190816/utaddress-204)
[    2.975509] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
[    2.992245] ACPI Warning: SystemIO range 0x0000000000000540-0x000000000000054F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20190816/utaddress-204)

[    2.992331] bnx2: QLogic bnx2 Gigabit Ethernet Driver v2.2.6 (January 29, 2014)
[    3.019454] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver
[    3.040639] bnx2 0000:01:00.0 eth0: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c0000000, IRQ 16, node addr d4:ae:52:ce:c5:c7
[    3.056877] ACPI Warning: SystemIO range 0x0000000000000530-0x000000000000053F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20190816/utaddress-204)
[    3.105212] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver

[    3.107974] bnx2 0000:01:00.1 eth1: Broadcom NetXtreme II BCM5716 1000Base-T (C0) PCI Express found at mem c2000000, IRQ 17, node addr d4:ae:52:ce:c5:c8
[    3.125047] ACPI Warning: SystemIO range 0x0000000000000500-0x000000000000052F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20190816/utaddress-204)
[    3.125050] ACPI: If an ACPI driver is available for this device, you should use it instead of the native driver

[    3.125051] lpc_ich: Resource conflict(s) found affecting gpio_ich
[    3.236453] i801_smbus 0000:00:1f.3: SMBus using PCI interrupt
[    3.247712] ACPI: watchdog: Skipping WDAT on this system because it uses RTC SRAM
[    3.259068] bnx2 0000:01:00.1 em2: renamed from eth1
[    3.281286] hidraw: raw HID events driver (C) Jiri Kosina
[    3.292098] ahci 0000:00:1f.2: version 3.0
[    3.292312] ahci 0000:00:1f.2: AHCI 0001.0300 32 slots 6 ports 3 Gbps 0x1 impl SATA mode
[    3.314195] ahci 0000:00:1f.2: flags: 64bit ncq pm led clo pio slum part ems apst
[    3.336052] scsi host0: ahci
[    3.347650] scsi host1: ahci
[    3.352484] bnx2 0000:01:00.0 em1: renamed from eth0