Auteur Sujet: Consommation électrique d'un serveur (récupérer l'info en ligne de commande)  (Lu 16064 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
Récupérer la consommation électrique d'un serveur via une ligne de commande

Il y a deux méthode que je vais donner :
- Via sensors
- Via IPMI

Sur certains serveurs la consommation électrique sera disponible uniquement via sensors et pour d'autres (par exemple les serveurs Dell) uniquement en IPMI. Sur le serveur IBM que j'utilise pour ce tutoriel, c'est disponible sur les deux.

A noter que de nombreux serveurs ne donnent pas cette information. Généralement, ce sont ceux avec une alimentation redondante qui intègre cette fonction.


vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
consomation serveur
« Réponse #1 le: 28 juin 2016 à 13:07:25 »
Consommation électrique via sensors

Installation :
sudo apt install lm-sensors
sudo sensors-detect


Le script sensors-detect va poser de nombreuses questions, il suffit de répondre yes systématiquement.
# sensors-detect
# sensors-detect revision 6284 (2015-05-31 14:00:33 +0200)
# System: IBM IBM System x3550 -[7978B4G]-
# Board: IBM System Planar
# Kernel: 4.4.0-22-generic x86_64
# Processor: Intel(R) Xeon(R) CPU E5430 @ 2.66GHz (6/23/6)

This program will help you determine which kernel modules you need
to load to use lm_sensors most effectively. It is generally safe
and recommended to accept the default answers to all questions,
unless you know what you're doing.

Some south bridges, CPUs or memory controllers contain embedded sensors.
Do you want to scan for them? This is totally safe. (YES/no):
Module cpuid loaded successfully.
Silicon Integrated Systems SIS5595...                       No
VIA VT82C686 Integrated Sensors...                          No
VIA VT8231 Integrated Sensors...                            No
AMD K8 thermal sensors...                                   No
AMD Family 10h thermal sensors...                           No
AMD Family 11h thermal sensors...                           No
AMD Family 12h and 14h thermal sensors...                   No
AMD Family 15h thermal sensors...                           No
AMD Family 16h thermal sensors...                           No
AMD Family 15h power sensors...                             No
AMD Family 16h power sensors...                             No
Intel digital thermal sensor...                             Success!
    (driver `coretemp')
Intel AMB FB-DIMM thermal sensor...                         Success!
    (driver `i5k_amb')
Intel 5500/5520/X58 thermal sensor...                       No
VIA C7 thermal sensor...                                    No
VIA Nano thermal sensor...                                  No

Some Super I/O chips contain embedded sensors. We have to write to
standard I/O ports to probe them. This is usually safe.
Do you want to scan for Super I/O sensors? (YES/no):
Probing for Super-I/O at 0x2e/0x2f
Trying family `National Semiconductor/ITE'...               Yes
Found `Nat. Semi. PC87427 Super IO Fan Sensors'             
    (but not activated)
Found `Nat. Semi. PC87427 Super IO Health Sensors'         
    (but not activated)
Probing for Super-I/O at 0x4e/0x4f
Trying family `National Semiconductor/ITE'...               No
Trying family `SMSC'...                                     No
Trying family `VIA/Winbond/Nuvoton/Fintek'...               No
Trying family `ITE'...                                      No

Some systems (mainly servers) implement IPMI, a set of common interfaces
through which system health data may be retrieved, amongst other things.
We first try to get the information from SMBIOS. If we don't find it
there, we have to read from arbitrary I/O ports to probe for such
interfaces. This is normally safe. Do you want to scan for IPMI
interfaces? (YES/no):
Found `IPMI BMC KCS' at 0xca8...                            Success!
    (confidence 8, driver `to-be-written')

Some hardware monitoring chips are accessible through the ISA I/O ports.
We have to write to arbitrary I/O ports to probe them. This is usually
safe though. Yes, you do have ISA I/O ports even if you do not have any
ISA slots! Do you want to scan the ISA I/O ports? (YES/no):
Probing for `National Semiconductor LM78' at 0x290...       No
Probing for `National Semiconductor LM79' at 0x290...       No
Probing for `Winbond W83781D' at 0x290...                   No
Probing for `Winbond W83782D' at 0x290...                   No

Lastly, we can probe the I2C/SMBus adapters for connected hardware
monitoring devices. This is the most risky part, and while it works
reasonably well on most systems, it has been reported to cause trouble
on some systems.
Do you want to probe the I2C/SMBus adapters now? (YES/no):
Using driver `i2c-i801' for device 0000:00:1f.3: Intel Enterprise Southbridge - ESB2
Module i2c-i801 loaded successfully.

Next adapter: Radeon i2c bit bus DVI_DDC (i2c-0)
Do you want to scan it? (yes/NO/selectively): yes

Next adapter: Radeon i2c bit bus VGA_DDC (i2c-1)
Do you want to scan it? (yes/NO/selectively): yes

Next adapter: Radeon i2c bit bus MONID (i2c-2)
Do you want to scan it? (yes/NO/selectively): yes

Next adapter: Radeon i2c bit bus CRT2_DDC (i2c-3)
Do you want to scan it? (yes/NO/selectively): yes

Next adapter: SMBus I801 adapter at 0440 (i2c-4)
Do you want to scan it? (YES/no/selectively):


Now follows a summary of the probes I have just done.
Just press ENTER to continue:

Driver `to-be-written':
  * ISA bus, address 0xca8
    Chip `IPMI BMC KCS' (confidence: 8)

Driver `coretemp':
  * Chip `Intel digital thermal sensor' (confidence: 9)

Driver `i5k_amb':
  * Chip `Intel AMB FB-DIMM thermal sensor' (confidence: 9)

Note: there is no driver for IPMI BMC KCS yet.
Check http://www.lm-sensors.org/wiki/Devices for updates.

To load everything that is needed, add this to /etc/modules:
#----cut here----
# Chip drivers
coretemp
i5k_amb
#----cut here----
If you have some drivers built into your kernel, the list above will
contain too many modules. Skip the appropriate ones!

Do you want to add these lines automatically to /etc/modules? (yes/NO)yes
Successful!

Monitoring programs won't work until the needed modules are
loaded. You may want to run '/etc/init.d/kmod start'
to load them.

Unloading i2c-i801... OK
Unloading cpuid... OK

Dans mon cas il a détecté 3 composants :
- Chip `IPMI BMC KCS' (confidence: 8 ) => Driver `to-be-written' => Pas de driver pour sensors mais je vous explique comment l'exploiter dans la seconde partie.

- Chip `Intel digital thermal sensor' (confidence: 9) => Driver `coretemp'

- Chip `Intel AMB FB-DIMM thermal sensor' (confidence: 9) => Driver `i5k_amb'

L'installation des 2 dirvers a été réalisé dans le fichier /etc/modules

Pour l'éditer : nano /etc/modules

Il faut ensuite redémarrer le serveur : sudo reboot
(il est possible de lancer les modules sans redémarer via sudo service kmod start)

Voici ce que donne comme info la commande sensors sur mon serveur : la consommation électrique est de 173.27 W, produisant une chaleur de 711.77 MJ

$ sensors
coretemp-isa-0000
Adapter: ISA adapter
Core 0:       +46.0°C  (high = +84.0°C, crit = +100.0°C)
Core 1:       +42.0°C  (high = +84.0°C, crit = +100.0°C)
Core 2:       +44.0°C  (high = +84.0°C, crit = +100.0°C)
Core 3:       +43.0°C  (high = +84.0°C, crit = +100.0°C)

i5k_amb-isa-0000
Adapter: ISA adapter
Ch. 0 DIMM 0:  +38.0°C  (low  = +94.0°C, high = +124.0°C)
Ch. 1 DIMM 0:  +36.0°C  (low  = +94.0°C, high = +124.0°C)
Ch. 2 DIMM 0:  +46.0°C  (low  = +93.0°C, high = +124.0°C)
Ch. 3 DIMM 0:  +37.0°C  (low  = +93.0°C, high = +124.0°C)

aem1-isa-0000
Adapter: ISA adapter
power1:      173.27 W (interval =   1.00 s)
energy1:     711.77 MJ

aem2-isa-0001
Adapter: ISA adapter
temp1:        +27.0°C 
temp2:        +17.0°C 
power1:      131.71 W  (interval =   1.00 s)
power2:      165.76 W  (interval =   1.00 s)
power3:       26.00 W 
power4:      371.00 W 
power5:      353.00 W 
power6:      307.30 W 
power7:      262.30 W 
energy1:     565.35 MJ
energy2:     711.77 MJ

ibmpex-isa-0000
Adapter: ISA adapter
temp1:         +0.0°C 
temp2:         +0.0°C 
temp3:         +0.0°C 
temp4:         +0.0°C 
power1:      154.40 W  (lowest = 110.30 W, highest = 208.00 W)
power2:      150.30 W  (lowest = 115.90 W, highest = 187.20 W)
power3:      150.10 W  (lowest = 116.60 W, highest = 186.30 W)
power4:      146.00 W  (lowest = 116.80 W, highest = 186.10 W)
power5:      143.00 W  (lowest = 116.90 W, highest = 184.50 W)
power6:      138.30 W  (lowest = 117.20 W, highest = 179.00 W)
power7:      138.60 W  (lowest = 132.10 W, highest = 166.20 W)
power8:      139.00 W  (lowest = 133.90 W, highest = 155.20 W)
power9:      186.00 W  (lowest = 127.00 W, highest = 255.00 W)
power10:     182.00 W  (lowest = 133.00 W, highest = 229.00 W)
power11:     172.00 W  (lowest = 172.00 W, highest = 220.00 W)


Au niveau des températures :

Température d'entrée de l'air :
temp2:        +17.0°C 

Température de sortie de l'air du serveur :
temp1:        +27.0°C 

Température des 4 cœurs du micro processeur :
Core 0:       +46.0°C  (high = +84.0°C, crit = +100.0°C)
Core 1:       +42.0°C  (high = +84.0°C, crit = +100.0°C)
Core 2:       +44.0°C  (high = +84.0°C, crit = +100.0°C)
Core 3:       +43.0°C  (high = +84.0°C, crit = +100.0°C)


Température des 4 barrettes mémoires :
Ch. 0 DIMM 0:  +38.0°C  (low  = +94.0°C, high = +124.0°C)
Ch. 1 DIMM 0:  +36.0°C  (low  = +94.0°C, high = +124.0°C)
Ch. 2 DIMM 0:  +46.0°C  (low  = +93.0°C, high = +124.0°C)
Ch. 3 DIMM 0:  +37.0°C  (low  = +93.0°C, high = +124.0°C)

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
Récupérer la consommation électrique d'un serveur
« Réponse #2 le: 28 juin 2016 à 13:14:44 »
Consommation électrique via IPMI

IPMI (Intelligent Platform Management Interface) est un composant sur la carte mère qui permet de surveiller le serveur et d'en prendre le contrôle à distance (ce composant est toujours sous tension et connecté à une carte réseau intégré du serveur, il permet donc d'allumer ou éteindre un serveur à distance)

Installation :
sudo apt install openipmi ipmitool

Récupération des informations :
sudo ipmitool sdr

Exemple toujours sur le même serveur : la consommation est de 160 watts et la température de l'air qui rentre dans le serveur est de 18°c :

$ sudo ipmitool sdr
Fan 1 Tach       | no reading        | ns
Fan 2 Tach       | no reading        | ns
Fan 3 Tach       | 8850 RPM          | ok
Fan 4 Tach       | 7125 RPM          | ok
Fan 5 Tach       | 7950 RPM          | ok
Fan 6 Tach       | 6075 RPM          | ok
Fan 7 Tach       | 8025 RPM          | ok
Fan 8 Tach       | 6075 RPM          | ok
Fan 9 Tach       | 9000 RPM          | ok
Fan 10 Tach      | 7950 RPM          | ok
Fan 11 Tach      | 9000 RPM          | ok
Fan 12 Tach      | 7650 RPM          | ok
Sys pwr monitor  | 0x00              | ok
Watchdog         | 0x00              | ok
Drive 1 Status   | 0x00              | ok
Drive 2 Status   | 0x00              | ok
Drive 3 Status   | Not Readable      | ns
Drive 4 Status   | Not Readable      | ns
RAID Error       | 0x00              | ok
Planar 3.3V      | 3.29 Volts        | ok
Planar 5V        | 5.10 Volts        | ok
Planar 12V       | 12.21 Volts       | ok
Planar VBAT      | 3.02 Volts        | ok
Ambient Temp     | 18 degrees C      | ok
AVG Power        | 160 Watts         | ok
CPU 1 Temp       | no reading        | ns
CPU 2 Temp       | no reading        | ns
RSA II Detect    | Not Readable      | ns
FP Cable Detect  | 0x00              | ok
USB Cable Detect | 0x00              | ok
DASD BP Detect   | 0x00              | ok
Riser 1 Detect   | 0x00              | ok
Riser 2 Detect   | 0x00              | ok
PS 1 Status      | 0x00              | ok
PS 2 Status      | Not Readable      | ns
VRD 1 Status     | 0x00              | ok
VRD 2 Status     | Not Readable      | ns
CPU 1 Status     | 0x00              | ok
CPU 2 Status     | Not Readable      | ns
NMI State        | 0x00              | ok
Power 12V Fault  | 0x00              | ok
Voltage Fault    | 0x00              | ok
PS 1 Fan Fault   | 0x00              | ok
PS 2 Fan Fault   | Not Readable      | ns
SEL Fullness     | 17 % messages     | ok
ABR Status       | 0x00              | ok
CPU Fault Reboot | 0x00              | ok
Critical Int     | 0x00              | ok
PwrPlanar Fault  | 0x00              | ok
CPU 1 OverTemp   | 0x00              | ok
CPU 2 OverTemp   | 0x00              | ok
CPU 1 PECI tics  | -65 unspecified   | ok
CPU 2 PECI tics  | no reading        | ns


D'autres commandes sont possible pour récupérer d'autres informations :

sudo ipmitool chassis status :
$ sudo ipmitool chassis status
System Power         : on
Power Overload       : false
Power Interlock      : inactive
Main Power Fault     : false
Power Control Fault  : false
Power Restore Policy : previous
Last Power Event     :
Chassis Intrusion    : inactive
Front-Panel Lockout  : inactive
Drive Fault          : false
Cooling/Fan Fault    : false


sudo ipmitool mc info :
$ sudo ipmitool mc info
Device ID                 : 32
Device Revision           : 0
Firmware Revision         : 1.39
IPMI Version              : 2.0
Manufacturer ID           : 2
Manufacturer Name         : Unknown (0x02)
Product ID                : 18 (0x0012)
Product Name              : Unknown (0x12)
Device Available          : yes
Provides Device SDRs      : no
Additional Device Support :
    Sensor Device
    SDR Repository Device
    SEL Device
    FRU Inventory Device
    IPMB Event Receiver
    IPMB Event Generator
    Chassis Device
Aux Firmware Rev Info     :
    0x47
    0x46
    0x42
    0x54


sudo ipmitool sensor :
$ sudo ipmitool sensor
Fan 1 Tach       | na         |            | na    | na        | na        | na        | na        | na        | na       
Fan 2 Tach       | na         |            | na    | na        | na        | na        | na        | na        | na       
Fan 3 Tach       | 8850.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 4 Tach       | 7125.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 5 Tach       | 7950.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 6 Tach       | 6075.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 7 Tach       | 8025.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 8 Tach       | 6150.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 9 Tach       | 9000.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 10 Tach      | 7950.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 11 Tach      | 9000.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Fan 12 Tach      | 7725.000   | RPM        | ok    | 750.000   | 1950.000  | 1950.000  | na        | na        | na       
Sys pwr monitor  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Watchdog         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Drive 1 Status   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
Drive 2 Status   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
Drive 3 Status   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Drive 4 Status   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
RAID Error       | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Planar 3.3V      | 3.292      | Volts      | ok    | na        | 3.027     | na        | na        | 3.558     | na       
Planar 5V        | 5.100      | Volts      | ok    | na        | 4.380     | na        | na        | 5.610     | na       
Planar 12V       | 12.212     | Volts      | ok    | na        | 10.579    | na        | na        | 13.348    | na       
Planar VBAT      | 3.024      | Volts      | ok    | na        | 2.295     | na        | na        | 3.807     | na       
Ambient Temp     | 18.000     | degrees C  | ok    | na        | na        | na        | 32.000    | na        | 39.000   
AVG Power        | 160.000    | Watts      | ok    | na        | na        | na        | na        | na        | na       
CPU 1 Temp       | na         |            | na    | na        | na        | na        | na        | na        | na       
CPU 2 Temp       | na         |            | na    | na        | na        | na        | na        | na        | na       
RSA II Detect    | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
FP Cable Detect  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
USB Cable Detect | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
DASD BP Detect   | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Riser 1 Detect   | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Riser 2 Detect   | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
PS 1 Status      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
PS 2 Status      | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
VRD 1 Status     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
VRD 2 Status     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
CPU 1 Status     | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na       
CPU 2 Status     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
NMI State        | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Power 12V Fault  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Voltage Fault    | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
PS 1 Fan Fault   | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
PS 2 Fan Fault   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
SEL Fullness     | 17.000     | % messages | ok    | 10.000    | 20.000    | 30.000    | 75.000    | 90.000    | 100.000   
ABR Status       | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
CPU Fault Reboot | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Critical Int     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
PwrPlanar Fault  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
CPU 1 OverTemp   | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
CPU 2 OverTemp   | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
CPU 1 PECI tics  | -65.000    | unspecified| ok    | na        | na        | na        | na        | na        | na       
CPU 2 PECI tics  | na         | unspecified| na    | na        | na        | na        | na        | na        | na       


ipmitool mc getsysinfo system_fw_version : (permet de récupérer la version du firmware)
# ipmitool mc getsysinfo system_fw_version
2.4.2

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
Récupérer la consommation électrique d'un serveur
« Réponse #3 le: 28 juin 2016 à 13:30:06 »
Pour grapher ces données dans le temps, il est possible d'utiliser Munin.

Ce sera l'objet d'un autre tutoriel.

N'hésitez pas à indiquer ce que cela donne sur vos serveurs et les commandes ipmitool intéressantes !

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
Voici l'impact d'une hausse de la température de 6 degrés sur un serveur IBM :


Les ventilateurs augmentent immédiatement leur vitesse de rotation :


La consommation supplèmentaire des ventilateurs se voit :


La hausse de la consommation me semble lié à l'augmentation de la vitesse des ventilateurs, car l'activité sur le serveur est resté stable pendant cette période de temps :





BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Ca vient d'où cette augmentation subite de température ?

vtimd

  • Abonné Orange Fibre
  • *
  • Messages: 1 211
  • Saint Martin d'Hères 38
Il a fait 6° de plus entre le 3 et 4 janvier ?
Ou la température dont tu parles n'a rien à voir avec la température extérieure?

Fuli10

  • Abonné Free fibre
  • *
  • Messages: 1 006
  • Conflans Sainte Honorine (78)
Perso je n'ai pas trouvé de quoi avoir la consommation sur mon serveur (Dell T110 II).
Franchement déçu  :'(


# sensors
acpitz-virtual-0
Adapter: Virtual device
temp1:        +29.8°C  (crit = +106.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0:  +28.0°C  (high = +85.0°C, crit = +105.0°C)
Core 0:         +26.0°C  (high = +85.0°C, crit = +105.0°C)
Core 1:         +24.0°C  (high = +85.0°C, crit = +105.0°C)
Core 2:         +30.0°C  (high = +85.0°C, crit = +105.0°C)
Core 3:         +18.0°C  (high = +85.0°C, crit = +105.0°C)

jc42-i2c-0-19
Adapter: SMBus I801 adapter at 3000
temp1:        +22.2°C  (low  =  +0.0°C)
                       (high = +91.0°C, hyst = +91.0°C)
                       (crit = +95.0°C, hyst = +95.0°C)

jc42-i2c-0-1b
Adapter: SMBus I801 adapter at 3000
temp1:        +23.8°C  (low  =  +0.0°C)
                       (high = +91.0°C, hyst = +91.0°C)
                       (crit = +95.0°C, hyst = +95.0°C)

# ipmitool sdr
Temp             | disabled          | ns
Ambient Temp     | 19 degrees C      | ok
Planar Temp      | disabled          | ns
CMOS Battery     | 0x00              | ok
0.75 VTT PG      | 0x00              | ok
1.2 AUX PG       | 0x00              | ok
1.8V PG          | 0x00              | ok
PSU PG           | 0x00              | ok
HEATSINK PRES    | 0x00              | ok
1.05V PG         | 0x00              | ok
MEM PG           | 0x00              | ok
VTT PG           | 0x00              | ok
1.8 PLL PG       | 0x00              | ok
VCORE            | 0x00              | ok
FAN 1 RPM        | 1740 RPM          | ok
Presence         | 0x00              | ok
Status           | 0x00              | ok
Watchdog         | 0x00              | ok
PFault Fail Safe | Not Readable      | ns
SEL              | Not Readable      | ns
Intrusion        | 0x00              | ok
Temp Interf      | Not Readable      | ns
Temp             | disabled          | ns
3.3V PG          | 0x00              | ok
ECC Corr Err     | Not Readable      | ns
ECC Uncorr Err   | Not Readable      | ns
I/O Channel Chk  | Not Readable      | ns
PCI Parity Err   | Not Readable      | ns
PCI System Err   | Not Readable      | ns
SBE Log Disabled | Not Readable      | ns
Logging Disabled | Not Readable      | ns
Unknown          | Not Readable      | ns
CPU Protocol Err | Not Readable      | ns
CPU Bus PERR     | Not Readable      | ns
CPU Init Err     | Not Readable      | ns
CPU Machine Chk  | Not Readable      | ns
Memory Spared    | Not Readable      | ns
Memory Mirrored  | Not Readable      | ns
Memory RAID      | Not Readable      | ns
Memory Added     | Not Readable      | ns
Memory Removed   | Not Readable      | ns
Memory Cfg Err   | Not Readable      | ns
Mem Redun Gain   | Not Readable      | ns
PCIE Fatal Err   | Not Readable      | ns
Chipset Err      | Not Readable      | ns
Err Reg Pointer  | Not Readable      | ns
Mem ECC Warning  | Not Readable      | ns
Mem CRC Err      | Not Readable      | ns
USB Over-current | Not Readable      | ns
POST Err         | Not Readable      | ns
Hdwr version err | Not Readable      | ns
Mem Overtemp     | Not Readable      | ns
Mem Fatal SB CRC | Not Readable      | ns
Mem Fatal NB CRC | Not Readable      | ns
OS Watchdog Time | Not Readable      | ns
Non Fatal PCI Er | Not Readable      | ns
Fatal IO Error   | Not Readable      | ns
MSR Info Log     | Not Readable      | ns

# ipmitool chassis status
System Power         : on
Power Overload       : false
Power Interlock      : inactive
Main Power Fault     : false
Power Control Fault  : false
Power Restore Policy : previous
Last Power Event     :
Chassis Intrusion    : inactive
Front-Panel Lockout  : inactive
Drive Fault          : false
Cooling/Fan Fault    : false
Sleep Button Disable : not allowed
Diag Button Disable  : allowed
Reset Button Disable : not allowed
Power Button Disable : allowed
Sleep Button Disabled: false
Diag Button Disabled : true
Reset Button Disabled: false
Power Button Disabled: false

# ipmitool mc info
Device ID                 : 32
Device Revision           : 0
Firmware Revision         : 1.95
IPMI Version              : 2.0
Manufacturer ID           : 674
Manufacturer Name         : DELL Inc
Product ID                : 256 (0x0100)
Product Name              : Unknown (0x100)
Device Available          : yes
Provides Device SDRs      : yes
Additional Device Support :
    Sensor Device
    SDR Repository Device
    SEL Device
    FRU Inventory Device
    IPMB Event Receiver
    Bridge
    Chassis Device
Aux Firmware Rev Info     :
    0x00
    0x01
    0x00
    0x00


# ipmitool sensor
Temp             | na         |            | na    | na        | na        | na        | na        | na        | na       
Ambient Temp     | 19.000     | degrees C  | ok    | na        | 3.000     | 8.000     | 42.000    | 47.000    | na       
Planar Temp      | na         |            | na    | na        | 3.000     | 8.000     | 90.000    | 95.000    | na       
CMOS Battery     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
0.75 VTT PG      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
1.2 AUX PG       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
1.8V PG          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
PSU PG           | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
HEATSINK PRES    | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
1.05V PG         | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
MEM PG           | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
VTT PG           | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
1.8 PLL PG       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
VCORE            | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
FAN 1 RPM        | 1740.000   | RPM        | ok    | na        | 840.000   | na        | na        | na        | na       
Presence         | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
Status           | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na       
Watchdog         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
PFault Fail Safe | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
SEL              | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Intrusion        | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na       
Temp Interf      | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Temp             | na         |            | na    | na        | na        | na        | na        | na        | na       
3.3V PG          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na       
ECC Corr Err     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
ECC Uncorr Err   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
I/O Channel Chk  | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
PCI Parity Err   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
PCI System Err   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
SBE Log Disabled | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Logging Disabled | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Unknown          | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
CPU Protocol Err | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
CPU Bus PERR     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
CPU Init Err     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
CPU Machine Chk  | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Memory Spared    | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Memory Mirrored  | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Memory RAID      | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Memory Added     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Memory Removed   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Memory Cfg Err   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Mem Redun Gain   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
PCIE Fatal Err   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Chipset Err      | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Err Reg Pointer  | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Mem ECC Warning  | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Mem CRC Err      | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
USB Over-current | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
POST Err         | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Hdwr version err | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Mem Overtemp     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Mem Fatal SB CRC | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Mem Fatal NB CRC | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
OS Watchdog Time | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Non Fatal PCI Er | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
Fatal IO Error   | na         | discrete   | na    | na        | na        | na        | na        | na        | na       
MSR Info Log     | na         | discrete   | na    | na        | na        | na        | na        | na        | na       


Du coup, j'utilise l'interface de l'onduleur pour récupérer la consommation globale de l'installation:

# cat get_power.sh
#!/bin/sh

# Author        : Donut
# Date          : 29 Jan. 2013
# Descritpion   : This script computes the actual power used by all the computers

UPS='homeups'
HOST='localhost'

VARPERC='ups.load'
VARNOMINAL='ups.realpower.nominal'

MJD=$(date '+%s')
HEURE=$(date '+%H')
MINUTE=$(date '+%M')

PERC=$(upsc ${UPS}@${HOST} $VARPERC)
NOMINAL=$(upsc ${UPS}@${HOST} $VARNOMINAL)
LOAD=$(echo "scale=3; $PERC*$NOMINAL/100" | bc -l)


echo "@$HEURE:$MINUTE \t Load =  $PERC% \t Conso. = $LOAD W"

# ./get_power.sh
@14:15   Load =  17%     Conso. = 81.600 W


Ma consommation en idle: 13% => 62.4W
Dont environ 8% pour le serveur - 38.4W
2% pour les composants réseau - 9.6W
3% pour la freebox server R1 - 14.4W (wifi/femmto off - +1% = 4.8W si femmto activée) => voilà pourquoi j'aimerai le remplacer par un modem VDSL qui consomme beaucoup moins, mais sans TV ni tel => pas possible
+ je ne sais pas combien de % en plus sur la prise pour l'onduleur.

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
Ca vient d'où cette augmentation subite de température ?
Il a fait 6° de plus entre le 3 et 4 janvier ?
Ou la température dont tu parles n'a rien à voir avec la température extérieure?
C'est la température dans un datacenter (Interxion2 à Aubervilliers), c'est donc indépendant de la température extérieure.

J'imagine qu'une unité de clim a eu un souci. Comme les allées froides ne sont pas isolées des allées chaudes, cela peut avoir un impact fort sur la température.

Je me demande pourquoi la température est fixée si basse (16°c en allée froide). Certains datacenter sont à 28°c en allée froide.
L'été, il faut emporter des vêtements à mettre dans le datacenter pour ne pas avoir froid.

BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Je me demande pourquoi la température est fixée si basse (16°c en allée froide).

T'as la réponse:

Citer
Comme les allées froides ne sont pas isolées des allées chaudes,

vivien

  • Administrateur
  • *
  • Messages: 47 183
    • Twitter LaFibre.info
Consommation électrique d'un serveur (récupérer l'info en ligne de commande)
« Réponse #10 le: 05 janvier 2017 à 18:49:35 »
Si tu peux développer, je suis intéressé : pourquoi la température en entrée de serveur devrait être plus basse dans ce type de datacenter ? (je ne sais pas a combien est réglé la clim, je vois juste la température de l'air aspiré par mon serveur)

L'isolation allée froide / allées chaude permet de récupérer un air bien plus chaud (il est forcèment passé par un serveur) et donc d'êtres plus efficace pour le refroidissement, par contre pour la température de l'air injecté dans les allées froides, j'ai un peu de mal à saisir pourquoi on ne devrait pas mettre la même température.

BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Consommation électrique d'un serveur (récupérer l'info en ligne de commande)
« Réponse #11 le: 05 janvier 2017 à 19:29:45 »
Si tu n'isoles pas correctement allée froide et chaude il s'opère un brassage de l'air dans le sens chaud vers froid. Ce mouvement passe soit par le haut des baies, soit par les côtés (il faut bien qu'on puisse circuler...) ou carrèment par les U vides sans panneau.

Ce brassage arrive d'autant plus facilement dans un DC où les équipements ne sont pas homogènes. Exemple: un Blade HP/IBM/Dell souffle bien plus fort qu'un serveur standard. Il souffle tellement fort que son air chaud va partir dans toutes les directions, surtout vers le haut... et revenir dans l'allée froide où il y a justement le Blade qui aspire l'air... Conséquence: cela créé un "point chaud" c'est-à-dire un endroit où l'air ambiant est plus élevé que la moyenne de la salle. Si l'écart n'est pas trop important, OSEF. Dans les cas extrèmes, il peut y avoir une dizaine de degrés d'écarts, ce qui peut alors être dommageable pour les équipements. Même punition avec les tiroirs de disques de baies NetApp/EMC/Hitachi/IBM : quand il y a une forte concentration à un endroit de la salle, il y a un gros risque de déséquilibre.

Solution: on souffle de l'air encore plus froid pour être sûr que l'air aspiré par les serveurs reste acceptable en tout point.

Une bonne isolation allée froide et chaude est donc une sérieuse optimisation en évitant de devoir envoyer de l'air plus froid pour tenir la consigne en tout point.