Auteur Sujet: Perte du réseau 10Gb/s (driver i40e) depuis le passage au Kernel 4.15  (Lu 7134 fois)

0 Membres et 1 Invité sur ce sujet

hwti

  • Abonné Orange Fibre
  • *
  • Messages: 2 237
  • Chambly (60)
Perte du réseau 10Gb/s (driver i40e) depuis le passage au Kernel 4.15
« Réponse #12 le: 21 août 2018 à 21:24:09 »
QP, c'est "num_queue_pairs", dont le calcul semble compliqué, et peut faire intervenir le nombre de vecteurs MSI-X (interruption) reservés, qui lui-même peut dériver du nombre de cœurs de la machine.
Le tout est lié au Receive Side Scaling : pouvoir répartir le trafic reçu sur les différents cœurs.

vivien

  • Administrateur
  • *
  • Messages: 47 086
    • Twitter LaFibre.info
Perte du réseau 10Gb/s (driver i40e) depuis le passage au Kernel 4.15
« Réponse #13 le: 22 août 2018 à 09:35:51 »
J'ai migré 10 serveurs Dell R310 équipés d'une carte carte Intel X710-DA2 en 4.15 et je pense avoir trouvé un autre point commun.


Avec l'ancien driver du kernel 4.13 j'ai systématiquement
[    2.912337] i40e 0000:01:00.0 eth0: NIC Link is Up, 10 Gbps Full Duplex, Flow Control: None

Avec le nouveau driver du kernel 4.15 j'ai :

Flow Control: RX/TX => machines qui fonctionnent parfaitement (6 serveurs sur les 10)

Flow Control: None => machines ont des erreurs (4 serveurs sur les 10)

Je suis maintenant persuadé que c'est un pb de configuration coté Cisco Nexus (l'équipement réseau de l'autre coté), vu que toutes les machines problématiques sont sur deux sites.

L’ancien driver i40e ne devait pas supporter le Flow Control et le nouveau bug si il n'est pas bien implèmenté.

hwti

  • Abonné Orange Fibre
  • *
  • Messages: 2 237
  • Chambly (60)
Perte du réseau 10Gb/s (driver i40e) depuis le passage au Kernel 4.15
« Réponse #14 le: 22 août 2018 à 10:10:31 »
Ce serait étrange que le Flow Control ne soit pas supporté par l'ancien driver.

Le bug est peut-être indirect, puisque ça affecte la vitesse des envois (si le PC dialogue avec une machine en gigabit derrière le switch par exemple).
Le cas sans Flow Control est le plus simple pour la carte : elle envoie les données à la vitesse maximum, quitte à ce que des trames Ethernet soient perdues plus loin sur le réseau. Mais du coup il est possible que les tx queues se vident plus vite dans ce mode, et donc que ça stresse un peu plus le driver.

vivien

  • Administrateur
  • *
  • Messages: 47 086
    • Twitter LaFibre.info
Perte du réseau 10Gb/s (driver i40e) depuis le passage au Kernel 4.15
« Réponse #15 le: 22 août 2018 à 10:30:39 »
J'ai oublié de préciser que au début je parlait d'une perte de réseau  : c'était le cas mais que après upgrade du firmware de la carte réseau, cela fonctionne, il y a seulement des serrures régulièrement. Le même problème s'est reproduit pour les 3 autres machines qui sont en "Flow Control: None" : pas de réseau tant que le firmware de la carte n'est pas upgradé.

Je n'ai pas eu besoin d'upgrader les firmwares des cartes réseaux pour les 6 serveurs qui fonctionnent avec Flow Control: RX/TX.

vivien

  • Administrateur
  • *
  • Messages: 47 086
    • Twitter LaFibre.info
Perte du réseau 10Gb/s (driver i40e) depuis le passage au Kernel 4.15
« Réponse #16 le: 24 août 2018 à 09:33:58 »
J'ai testé pour un serveur non impacté l'upgarde dans le dernier firmwzare (18.5.17 depuis la version précédente, la 18.3.6)
=> Le nouveaux firmware désactive le "Flow Control: RX/TX" et je me retrouve en "Flow Control: None" mais sans erreurs.



Les serveur impacté ayant tous été upgradés sans quoi il n'y avait pas de réseau, le "Flow Control: None" est la conséquence de l'upgrade et non l'origine du problème.

La seule différence reste donc le QP qui est à 8 pour un serveur sans problème et à 16 pour un serveur avec problème.

Je reste impressionné par le nombre de bugs qui peuvent être présents (et résolus) sur une simple carte réseau Intel X710...

Firmware 18.5.17,A00 11 juin 2018


Fixes
- Fixed link stability issue when 1G/10G dual speed optic module is used with Intel (R) X710 devices
- Fixed issue that incorrectly disabled and identified Dell SFP+ LR optic devices as unsupported devices with Intel(R) 10GbE 2P X710 Adapter
- Fixed PCIe training issue that may occasionally cause system halt during POST for some Intel(R) X710/XL710 devices
- Fixed issue that may cause system to delay for few minutes when entering Dell Lifecycle Controller when NPAR is enabled on some platforms for Intel(R) X710 devices
- Fixed issue that may show incorrect MAC address in Dell Lifecycle Controller when the MAC address is updated by iDRAC for Intel(R) X710 devices
- Fixed LLDP issue on Intel(R) X710 devices that caused Dell iDRAC Connection view to not work properly
- Fixed issue with the Intel(R) 25GbE XXV710 not properly identifying cable media which caused link to be established at 10GbE instead of 25GbE
- Fixed issue that may incorrectly show 'Wake on LAN' feature supported for some Intel(R) X710 devices
- The value of 'PCI VF Advertised' is now correctly applied from HII by enforcing a reset after update
- The UEFI driver now correctly resets all iSCSI related settings when the device is reset to the factory default
- The firmware update process now preserves configuration parameters related to 25G AOC cables and capabilities to prevent link loss due to resetting of configuration parameters during firmware update
- Fixed issue that mistakenly caused messages to appear in Lifecycle Log saying "Unable to configure the virtual address..."

Enhancements
- The firmware update process is optimized to stop update process immediately after error or failure
- Added support for Intel(R) Ethernet 25G 2P XXV710 Mezz



Firmware 18.3.6,A00 14 déc. 2017

Correctifs
- Résolution d’un problème entraînant l’échec d’installation du pilote sur des fonctions virtuelles Intel® X710 dans des systèmes d’exploitation invité installés sur des machines virtuelles ESXi. Pour appliquer le correctif, effectuez les opérations suivantes :
1. Mettez à jour du micrologiciel via le système d’exploitation (pas via Lifecycle Controller ou iDRAC)
2. Dans le BIOS, changez le mode de la virtualisation de « NPar + SR-IOV » en « None »
3. Redémarrez le système
4. Dans le BIOS, changez le mode de la virtualisation de « None » en « NPar + SR-IOV »
- Résolution d’un problème lié à la fonctionnalité de restauration dans iDRAC9 où Lifecycle Controller ne fonctionne pas pour les appareils Intel pris en charge par ce package.
- Résolution d’un problème de démarrage PXE sur la carte Intel® Ethernet X710-T lorsque le VLAN est activé.
- Résolution du problème lié à la carte Intel® X710 entraînant l’échec de connexion à une vitesse de 1 Gb avec des èmetteurs-récepteurs optiques 1 GbE.
- Résolution du problème avec les partitions sur les cartes X710 qui s’affichent dans iDRAC même lorsqu’elles sont désactivées.
- Résolution d’un problème avec les appareils équipés de cartes Intel® X710 entraînant l’affichage d’une valeur incorrecte de 0 pour « PCI Virtual Functions Advertised » après la réinitialisation de la valeur par défaut.
- Résolution du problème avec de longs temps de démarrage en mode de démarrage UEFI avec le serveur PXE avec les cartes Intel® X710.
- Résolution d’un problème avec les appareils X710/XL710 qui rencontraient une perte de communication lors de la désactivation du contrôle du flux et lorsque le système était redémarré à chaud pour les systèmes expéditeurs et destinataires.

Améliorations
- Mise à jour de messages d’avertissement et d’erreur pour les dispositifs optiques ne répondant pas aux exigences thermiques.
- Prise en charge de l’adaptateur Intel® Ethernet 25G 2P XXV710, qui est un adaptateur 25G à deux ports SFP28 profil bas/pleine hauteur.
- Ajout de la prise en charge pour Red Hat Enterprise Linux 7.4
- Ajout de la prise en charge pour Red Hat Enterprise Linux 6.9
- Ajout de la prise en charge de SUSE Linux Enterprise Server 12 SP3



Firmware 18.0.17,A00 30 août 2017

Correctifs
- Résolution du problème suivant : la carte fille réseau Intel® X710-k bNDC renvoie un échec lors du test de diagnostic ePSA avec le code d’erreur 2000-0620 lorsqu’elle est connectée à la vitesse de liaison 1G
- Rectification de l’avertissement sur l’intégrité du pilote UEFI qui s’affiche lors de l’insertion d’un module SFP+ ou QSFP non pris en charge
- Modification du pilote UEFI pour que la fonction NParEP ne puisse pas être activée lorsque NPar n’est pas activé
- Résolution du problème suivant : cartes 40 Gigabit identifiées comme des cartes 10 Gigabit
- Réduction de l’espace de stockage utilisé par le micrologiciel pour la restauration de Lifecycle Controller
- Résolution d’un problème entraînant l’échec de la mise à jour du micrologiciel vers la version 18.0.16 sur les configurations comprenant plusieurs adaptateurs Intel®

Améliorations
- Ajout de la prise en charge de la carte réseau convergé Ethernet Intel® X710-T
- Ajout de la prise en charge de l’adaptateur serveur Ethernet Intel(R) X710-DA2 pour OCP
- Blocage de la configuration d’adresse MAC virtuelle non valide
- Blocage des valeurs de sous-réseau de l’initiateur iSCSI non valides
- Prise en charge des modules optiques. Reportez-vous à la section « SFP+ and QSFP+ Devices » (Appareils SFP+ et QSFP+) du Guide d’utilisation pour en savoir plus
- Amélioration de la description indiquant les modes d’alimentation applicables au paramètre Wake on LAN
- Création de la possibilité de restaurer les valeurs par défaut pour les paramètres avec la touche F2 : paramètres de l’appareil



Firmware 17.5.12,A00 21 déc. 2016

Fixes
- Firmware Update can now update eight Intel X710 Network Adapters with NparEP enabled on all the cards from Firmware version 17.0.12
- Intel X710 might have shown a mismatch in packet drops when stress testing it
- Security vulnerability exclusive to Intel X710 and XL710 Firmware version 17.5.10
- Security vulnerability exclusive to Intel X710 and XL710 Firmware version 17.5.11

Enhancements
- PXE enabled on function 0 by default on X710 rNDC and bNDC devices
- Added support for Intel(R) Ethernet Converged Network Adapter XL710-Q2
- Added support for Intel(R) Ethernet 40G 2P XL710 QSFP+ rNDC
- Added support for Red Hat Enterprise Linux 7.2 x86_64
- Added support for Novell SUSE Linux Enterprise Server 12 SP1



Firmware 17.5.11,A00 15 juin 2016

Correctifs
- La mise à jour du micrologiciel peut désormais s’appliquer à huit cartes réseau Intel X710 avec la fonction NparEP activée sur toutes les cartes, à partir du micrologiciel version 17.0.12
- La carte Intel X710 a pu montrer une disparité au niveau des abandons de paquets au cours des tests de résistance
- Vulnérabilités exclusives aux micrologiciels Intel X710 et XL710 version 17.5.10

Améliorations
- Environnement PXE activé par défaut sur la fonction 0 sur la carte fille réseau rack et la carte fille réseau lame X710
- Ajout de la prise en charge de la carte réseau convergé Ethernet Intel® XL710-Q2
- Ajout de la prise en charge de la carte fille réseau rack Ethernet 40G à 2 ports QSFP+ Intel® XL710
- Ajout de la prise en charge de Red Hat Enterprise Linux 7.2 x86_64
- Ajout de la prise en charge de Novell SUSE Linux Enterprise Server 12 SP1



Firmware 17.0.12,A00 08 déc. 2015

Fixes
- Partition Min/Max bandwidth value change made in BIOS is intermittently not retained after reboot
- Minimum bandwidth is not distributed equally between the physical functions when enabling NPAR/NPAR EP
- Server Profile Import fails due to incorrect read/write setting of "iScsiOffloadMode" attribute if NPar mode and NParEP is disabled
- "iSCSI Offload Mode" setting displayed in BIOS on X710 devices that do not support iSCSI offload
- "VFDistribution" attribute in the BIOS should not be writeable when VirtualizationMode is set to NPAR
- X710 devices do not display all partition information correctly in Hardware inventory in iDRAC
- X710 device fails to connect and download files from PXE server via IPv6 in UEFI PXE mode

Enhancements
- Added FW DUP support for Windows 10 x64
- Default value for Virtual FIP MAC address changed to "00:00:00:00:00:00"