Auteur Sujet: OpenWRT / BPI-R4 + SFP 10Gbs - Reconnexion toutes les 23h -- [workaround]  (Lu 2470 fois)

0 Membres et 5 Invités sur ce sujet

G8U5

  • Abonné Orange Fibre
  • *
  • Messages: 174
  • La Rochelle 17
Bonjour à tous, je rencontre depuis mon arrivée chez Orange des déconnexions régulières sans comprendre d'où cela provient.
Ma fibre arrive dans un WAS-110 8311 v2.8, raccordé sur un BananaPi R4 faisant tourner OpenWRT 24.10.1.
Mes débits sont de 7200mb/s en descendant et 5600 en montant.

Les tutos utilisés sont:
 - https://lafibre.info/remplacer-livebox/xgs-pon-remplacement-de-la-livebox-7-10gbe/
 - https://lafibre.info/remplacer-livebox/remplacement-de-la-livebox-par-un-routeur-openwrt-18-dhcp-v4v6-tv/

Tout va bien, sauf cette histoire de déconnexion toutes les environs 23h. J'ai alors un cron qui ping toutes les 2 minutes pour relancer les interfaces WAN et WAN6 quand ça arrive.

J'aimerais bien comprendre d'où ça vient afin d'éliminer le problème.

Veuillez noter que même si eth2 devient down, je ne perds pas le lien shh ou interface web du WAS-110.

Voici un extrait qui me semble pertinent des logs:

Kernel OpenWRT:
[1339464.546688] sfp sfp1: module removed
[1339464.550471] mtk_soc_eth 15100000.ethernet eth2: Link is Down
[1339464.870312] sfp sfp1: module FiberMall        XGSPON-ONU-STICK rev V1.0 sn MT250650938      dc 250327 
[1339464.910206] hwmon hwmon2: temp1_input not attached to any thermal zone
[1339464.971702] mtk_soc_eth 15100000.ethernet eth2: Link is Up - 10Gbps/Full - flow control off

Kernel du WAS-110:
[1535157.875545] sw-multicast: port 1(gem65534) entered disabled state
[1535158.110493] device pmapper4358 left promiscuous mode
[1535158.114666] sw257: port 7(pmapper4358) entered disabled state
[1535158.121322] device pmapper4357 left promiscuous mode
[1535158.125432] sw257: port 6(pmapper4357) entered disabled state
[1535158.132068] device pmapper4356 left promiscuous mode
[1535158.136439] sw257: port 5(pmapper4356) entered disabled state
[1535158.143005] device pmapper4355 left promiscuous mode
[1535158.147476] sw257: port 4(pmapper4355) entered disabled state
[1535158.153973] device gem65533 left promiscuous mode
[1535158.158227] sw257: port 3(gem65533) entered disabled state
[1535158.164460] device pmapper4354 left promiscuous mode
[1535158.169005] sw257: port 2(pmapper4354) entered disabled state
[1535158.175515] device eth0_0 left promiscuous mode
[1535158.179574] sw257: port 1(eth0_0) entered disabled state
[1535158.303768] device gem65534 left promiscuous mode
[1535158.307660] sw-multicast: port 1(gem65534) entered disabled state
[1535158.345916] device eth0_0_2 left promiscuous mode
[1535158.349695] sw-multicast: port 2(eth0_0_2) entered disabled state
[1535176.145032] sw257: port 1(eth0_0) entered blocking state
[1535176.149188] sw257: port 1(eth0_0) entered disabled state
[1535176.155734] device eth0_0 entered promiscuous mode
[1535176.160090] sw257: port 1(eth0_0) entered blocking state
[1535176.165006] sw257: port 1(eth0_0) entered forwarding state
[1535177.802702] sw257: port 2(pmapper4354) entered blocking state
[1535177.807289] sw257: port 2(pmapper4354) entered disabled state
[1535177.814406] device pmapper4354 entered promiscuous mode

« Modifié: Aujourd'hui à 20:32:00 par G8U5 »

Mastah

  • Abonné Orange Fibre
  • *
  • Messages: 739
  • XGS-PON et G-PON
WAS-110 - 8gb - Reconnexion toutes les 23h
« Réponse #1 le: 29 septembre 2025 à 03:09:25 »
Il me semble que c'est le client DHCP qui ne respect pas le renew time. De mémoire quelqu'un en parlait ici. A prendre avec des pincettes, je dis ça de mémoire.

levieuxatorange

  • Expert Orange
  • Expert
  • *
  • Messages: 326
WAS-110 - 8gb - Reconnexion toutes les 23h
« Réponse #2 le: 29 septembre 2025 à 09:16:20 »
Tout va bien, sauf cette histoire de déconnexion toutes les environs 23h. J'ai alors un cron qui ping toutes les 2 minutes pour relancer les interfaces WAN et WAN6 quand ça arrive.
Hello

Si c'est 23h30 (la fin du timer T1) c'est que ton RENEW ne sort pas avec la bonne QoS / DSCP => Déco immédiate

Par contre comme mettre ça en place sur OpenWRT, je sais pas te dire

Le Vieux

ubune

  • Abonné Orange Fibre
  • *
  • Messages: 333
WAS-110 - 8gb - Reconnexion toutes les 23h
« Réponse #3 le: 29 septembre 2025 à 12:22:21 »
En effet ça ressemble à un soucis lors du renew, normalement nftables match les règles udp 547 et udp 67 uniquement lors du renew (y'a que dans le cadre du renew que ça passe dans la table).

Regarde ce message (vérifie si t'as bien les mêmes règles) :
https://lafibre.info/remplacer-livebox/remplacement-de-la-livebox-par-un-routeur-openwrt-18-dhcp-v4v6-tv/msg1059713/#msg1059713

Mastah

  • Abonné Orange Fibre
  • *
  • Messages: 739
  • XGS-PON et G-PON
WAS-110 - 8gb - Reconnexion toutes les 23h
« Réponse #4 le: 29 septembre 2025 à 14:09:49 »
Peux-tu changer le titre de ton post de
Citer
WAS-110 - 8gb - Reconnexion toutes les 23h
à
Citer
OpenWRT - 8gb - Reconnexion toutes les 23h
?

Le WAS-110 n'a rien a voir avec ton problème et ne permettra probablement pas à d'autre de retrouver ton poste lors de leurs recherches.

basilix

  • Abonné Orange Fibre
  • *
  • Messages: 857
    • Mon dépôt GitHub
WAS-110 - 8gb - Reconnexion toutes les 23h
« Réponse #5 le: 30 septembre 2025 à 07:48:01 »
En faisant partiellement abstraction de la configuration on pourrait réduire les erreurs. Sur OpenWrt, je prévois d'employer un script Lua.
C'est plutôt chiant mais j'ai presque finalisé mon initiation au langage. L'idée est de réécrire automatiquement la configuration existante
en y intégrant les paramètres du FAI. Après avoir passé en revue libuci et lua-libuci, je réfléchirais à la logique du script. L'avantage d'un
installateur (uci-defaults via un script lua/UCI) sera de créer un processus standard et actualisé.

G8U5

  • Abonné Orange Fibre
  • *
  • Messages: 174
  • La Rochelle 17
OpenWRT / BPI-R4 + SFP - Reconnexion toutes les 23h
« Réponse #6 le: Aujourd'hui à 19:00:18 »
Salutations !

Bon, voilà, j'ai mis le temps, mais j'ai décidé de m'y remettre et de solder cette affaire...

D'abord, j'avais un problème de config de l'option 11 du DHCPv6.
J'ai activé le log OMCI dans l'ONU FiberMall. Un reset arrivait toutes les 23:45.
J'ai activé le quirk pour ne pas prendre en compte les tx_fault en changeant le VendorName et PN (YV et SFP+ONU-XGSPON).

A ce stade, il y avais toujours des déconnexions lors de fortes charges.

Après analyse de "cat /proc/interrupts | grep sfp1", sfp1_mod_def0 montrait beaucoup d'interruptions, qui se voyait dans le log par "SFP Module removed".
Il y a donc un problème, soit d'alimentation pas propre, soit du bruit sur la piste PCB causé par je ne sais trop quoi.
Les logs de température et tension du module SFP restaient dans les specs, mais les microcoupures ne se voient pas.

Ma solution à été de recompiler OpenWRT en supprimant l'interrupt depuis le DTB.
Depuis, plus de déconnexion et odchp semble bien gérer t1 et t2 passant par la COS6.

Quand j'aurais un moment, je prendrais le temps de brancher l'oscillo sur l'alim pour voir.

Maintenant, je peux changer le Titre du post, car il semble effectivement que la pin6 (MOD_ABS/MOD_DEF0) du module soit directement reliée au 3.3V ça ne peut donc pas être du fait du processeur.
« Modifié: Aujourd'hui à 19:29:54 par G8U5 »

Aize147

  • Abonné Orange Fibre
  • *
  • Messages: 1 017
  • Orange FTTH 8G/8G - Free FTTH 8G/8G
OpenWRT / BPI-R4 + SFP - Reconnexion toutes les 23h
« Réponse #7 le: Aujourd'hui à 19:29:37 »
Salutations !

Bon, voilà, j'ai mis le temps, mais j'ai décidé de m'y remettre et de solder cette affaire...

D'abord, j'avais un problème de config de l'option 11 du DHCPv6.
J'ai activé le log OMCI dans l'ONU FiberMall. Un reset arrivait toutes les 23:45.
J'ai activé le quirk pour ne pas prendre en compte les tx_fault en changeant le VendorName et PN (YV et SFP+ONU-XGSPON).

A ce stade, il y avais toujours des déconnections lors de fortes charges.

Après analyse de "cat /proc/interrupts | grep sfp1", sfp1_mod_def0 montrait beaucoup d'interruptions, qui se voyait dans le log par "SFP Module removed".
Il y a donc un problème, soit d'alimentation pas propre, soit du bruit sur la piste PCB causé par je ne sais trop quoi.

Ma solution à été de recompiler OpenWRT en supprimant l'interrupt depuis le DTB.
Depuis, plus de déconnection et odchp semble bien gérer t1 et t2.

Quand j'aurais un moment, je prendrais le temps de brancher l'oscillo sur l'alim pour voir.

Maintenant, je peux changer le Titre du post, car il semble effectivement que la pin6 (MOD_ABS/MOD_DEF0) du module soit directement reliée au 3.3V ça ne peut donc pas être du fait du processeur.

Pour le quirk (Yunvo) il est déjà présent dans la version snapshot et RC de OpenWRT car le noyau est en 6.12..., contrairement à la version stable qui tourne sur un noyau 6.6... .

Pour ce qui est de l'alimentation il faut absolument utiliser une alimentation DC Jack 12v - 5A.

Le port USB-C PD ne permettant pas d'alimenter de façon optimale les 2 ports SFP+ lors des pics de charge.

G8U5

  • Abonné Orange Fibre
  • *
  • Messages: 174
  • La Rochelle 17
OpenWRT / BPI-R4 + SFP 10Gbs - Reconnexion toutes les 23h
« Réponse #8 le: Aujourd'hui à 19:36:22 »
L'alim est celle vendue avec le routeur, 12VDC 5A JACK, mais est elle propre ?, je peux aussi le brancher directement sur l'alim HP Proliant 460W qui me sert d'alim à tout faire à proximité.

Le routeur peut supporter des modules de 3W, le module fait 3W.

Mon module est un FiberMall, c'était donc son VendorName avant que je ne le change pour YV.
J'aurais aussi pu faire un Quirk pour le VendorName Fibermall et son PN pour désactiver l'IRQ.

La version d'OpenWRT est la 24.10.5 (custom build, DTB modifié), pas un snapshot pour pouvoir profiter du repo, le quirk TX_fault est là.