Auteur Sujet: Disque dur HS mais SMART dit que tout est ok  (Lu 8968 fois)

0 Membres et 1 Invité sur ce sujet

Tristos

  • Expert.
  • Abonné Orange Fibre
  • *
  • Messages: 52
  • Paris 12ème (75)
Disque dur HS mais SMART dit que tout est ok
« Réponse #12 le: 24 janvier 2014 à 18:16:06 »
Etrange tout ca... Mais pour un serveur de tests de débits, pourquoi ne pas essayer XFS plutôt que EXT4 ?

Edit Vivien : J'ai mis la réponse dans un post a part => Mise en place d'un RamDisque au démarrage

vivien

  • Administrateur
  • *
  • Messages: 47 083
    • Twitter LaFibre.info
Disque dur HS mais SMART dit que tout est ok
« Réponse #13 le: 10 mars 2014 à 09:47:34 »
Je n'ai toujours pas changé le disque dur du serveur, vu que le disque dur de remplacement étais HS. Le SAV Segate m'a rapidement renvoyé un nouveau disque dur de remplacement que je n'ai pas été mettre sur le serveur car tout semblais ok.

Hier, c'est la partition sda3 (/home) qui est passé en read-only.
Voici les logs de /var/log/kern.log :
Mar  8 08:15:43 ubuntu kernel: [5225780.384811] ata1.00: exception Emask 0x0 SAct 0x3 SErr 0x0 action 0x0
Mar  8 08:15:43 ubuntu kernel: [5225780.385620] ata1.00: irq_stat 0x40000001
Mar  8 08:15:43 ubuntu kernel: [5225780.386122] ata1.00: failed command: READ FPDMA QUEUED
Mar  8 08:15:43 ubuntu kernel: [5225780.386784] ata1.00: cmd 60/10:00:a0:0c:75/00:00:e6:00:00/40 tag 0 ncq 8192 in
Mar  8 08:15:43 ubuntu kernel: [5225780.386784]          res 41/40:00:a4:0c:75/00:00:e6:00:00/40 Emask 0x409 (media error) <F>
Mar  8 08:15:43 ubuntu kernel: [5225780.388697] ata1.00: status: { DRDY ERR }
Mar  8 08:15:43 ubuntu kernel: [5225780.388967] ata1.00: error: { UNC }
Mar  8 08:15:43 ubuntu kernel: [5225780.389166] ata1.00: failed command: WRITE FPDMA QUEUED
Mar  8 08:15:43 ubuntu kernel: [5225780.389495] ata1.00: cmd 61/38:08:80:0e:76/01:00:76:00:00/40 tag 1 ncq 159744 out
Mar  8 08:15:43 ubuntu kernel: [5225780.389495]          res 41/40:00:00:00:00/00:00:00:00:00/00 Emask 0x9 (media error)
Mar  8 08:15:43 ubuntu kernel: [5225780.391396] ata1.00: status: { DRDY ERR }
Mar  8 08:15:43 ubuntu kernel: [5225780.391894] ata1.00: error: { UNC }
Mar  8 08:15:43 ubuntu kernel: [5225780.401338] ata1.00: configured for UDMA/133
Mar  8 08:15:43 ubuntu kernel: [5225780.401353] sd 0:0:0:0: [sda] Unhandled sense code
Mar  8 08:15:43 ubuntu kernel: [5225780.401356] sd 0:0:0:0: [sda] 
Mar  8 08:15:43 ubuntu kernel: [5225780.401358] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Mar  8 08:15:43 ubuntu kernel: [5225780.401361] sd 0:0:0:0: [sda] 
Mar  8 08:15:43 ubuntu kernel: [5225780.401362] Sense Key : Medium Error [current] [descriptor]
Mar  8 08:15:43 ubuntu kernel: [5225780.401366] Descriptor sense data with sense descriptors (in hex):
Mar  8 08:15:43 ubuntu kernel: [5225780.401368]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Mar  8 08:15:43 ubuntu kernel: [5225780.401378]         e6 75 0c a4
Mar  8 08:15:43 ubuntu kernel: [5225780.401382] sd 0:0:0:0: [sda] 
Mar  8 08:15:43 ubuntu kernel: [5225780.401385] Add. Sense: Unrecovered read error - auto reallocate failed
Mar  8 08:15:43 ubuntu kernel: [5225780.401395] sd 0:0:0:0: [sda] CDB:
Mar  8 08:15:43 ubuntu kernel: [5225780.401396] Read(10): 28 00 e6 75 0c a0 00 00 10 00
Mar  8 08:15:43 ubuntu kernel: [5225780.401400] end_request: I/O error, dev sda, sector 3866430628
Mar  8 08:15:43 ubuntu kernel: [5225780.402130] sd 0:0:0:0: [sda] Unhandled sense code
Mar  8 08:15:43 ubuntu kernel: [5225780.402131] sd 0:0:0:0: [sda] 
Mar  8 08:15:43 ubuntu kernel: [5225780.402132] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Mar  8 08:15:43 ubuntu kernel: [5225780.402133] sd 0:0:0:0: [sda] 
Mar  8 08:15:43 ubuntu kernel: [5225780.402134] Sense Key : Medium Error [current] [descriptor]
Mar  8 08:15:43 ubuntu kernel: [5225780.402135] Descriptor sense data with sense descriptors (in hex):
Mar  8 08:15:43 ubuntu kernel: [5225780.402136]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Mar  8 08:15:43 ubuntu kernel: [5225780.402148]         00 00 00 00
Mar  8 08:15:43 ubuntu kernel: [5225780.402150] sd 0:0:0:0: [sda] 
Mar  8 08:15:43 ubuntu kernel: [5225780.402150] Add. Sense: Unrecovered read error - auto reallocate failed
Mar  8 08:15:43 ubuntu kernel: [5225780.402152] sd 0:0:0:0: [sda] CDB:
Mar  8 08:15:43 ubuntu kernel: [5225780.402152] Write(10): 2a 00 76 76 0e 80 00 01 38 00
Mar  8 08:15:43 ubuntu kernel: [5225780.402156] end_request: I/O error, dev sda, sector 1987448448
Mar  8 08:15:43 ubuntu kernel: [5225780.402890] ata1: EH complete
Mar  8 08:15:43 ubuntu kernel: [5225780.402916] Aborting journal on device sda3-8.
Mar  8 08:15:45 ubuntu kernel: [5225782.230519] ata1.00: exception Emask 0x0 SAct 0x3 SErr 0x0 action 0x0
Mar  8 08:15:45 ubuntu kernel: [5225782.231426] ata1.00: irq_stat 0x40000001
Mar  8 08:15:45 ubuntu kernel: [5225782.231927] ata1.00: failed command: READ FPDMA QUEUED
Mar  8 08:15:45 ubuntu kernel: [5225782.232582] ata1.00: cmd 60/10:00:a0:0c:75/00:00:e6:00:00/40 tag 0 ncq 8192 in
Mar  8 08:15:45 ubuntu kernel: [5225782.232582]          res 41/40:00:a4:0c:75/00:00:e6:00:00/40 Emask 0x409 (media error) <F>
Mar  8 08:15:45 ubuntu kernel: [5225782.234167] ata1.00: status: { DRDY ERR }
Mar  8 08:15:45 ubuntu kernel: [5225782.234400] ata1.00: error: { UNC }
Mar  8 08:15:45 ubuntu kernel: [5225782.234657] ata1.00: failed command: WRITE FPDMA QUEUED
Mar  8 08:15:45 ubuntu kernel: [5225782.235341] ata1.00: cmd 61/08:08:00:e0:30/00:00:04:00:00/40 tag 1 ncq 4096 out
Mar  8 08:15:45 ubuntu kernel: [5225782.235341]          res 41/40:00:00:00:00/00:00:00:00:00/00 Emask 0x9 (media error)
Mar  8 08:15:45 ubuntu kernel: [5225782.237215] ata1.00: status: { DRDY ERR }
Mar  8 08:15:45 ubuntu kernel: [5225782.237726] ata1.00: error: { UNC }
Mar  8 08:15:45 ubuntu kernel: [5225782.247254] ata1.00: configured for UDMA/133
Mar  8 08:15:45 ubuntu kernel: [5225782.247267] sd 0:0:0:0: [sda] Unhandled sense code
Mar  8 08:15:45 ubuntu kernel: [5225782.247270] sd 0:0:0:0: [sda] 
Mar  8 08:15:45 ubuntu kernel: [5225782.247272] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Mar  8 08:15:45 ubuntu kernel: [5225782.247274] sd 0:0:0:0: [sda] 
Mar  8 08:15:45 ubuntu kernel: [5225782.247276] Sense Key : Medium Error [current] [descriptor]
Mar  8 08:15:45 ubuntu kernel: [5225782.247279] Descriptor sense data with sense descriptors (in hex):
Mar  8 08:15:45 ubuntu kernel: [5225782.247281]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Mar  8 08:15:45 ubuntu kernel: [5225782.247291]         e6 75 0c a4
Mar  8 08:15:45 ubuntu kernel: [5225782.247295] sd 0:0:0:0: [sda] 
Mar  8 08:15:45 ubuntu kernel: [5225782.247298] Add. Sense: Unrecovered read error - auto reallocate failed
Mar  8 08:15:45 ubuntu kernel: [5225782.247300] sd 0:0:0:0: [sda] CDB:
Mar  8 08:15:45 ubuntu kernel: [5225782.247301] Read(10): 28 00 e6 75 0c a0 00 00 10 00
Mar  8 08:15:45 ubuntu kernel: [5225782.247315] end_request: I/O error, dev sda, sector 3866430628
Mar  8 08:15:45 ubuntu kernel: [5225782.248040] sd 0:0:0:0: [sda] Unhandled sense code
Mar  8 08:15:45 ubuntu kernel: [5225782.248042] sd 0:0:0:0: [sda] 
Mar  8 08:15:45 ubuntu kernel: [5225782.248042] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Mar  8 08:15:45 ubuntu kernel: [5225782.248043] sd 0:0:0:0: [sda] 
Mar  8 08:15:45 ubuntu kernel: [5225782.248044] Sense Key : Medium Error [current] [descriptor]
Mar  8 08:15:45 ubuntu kernel: [5225782.248045] Descriptor sense data with sense descriptors (in hex):
Mar  8 08:15:45 ubuntu kernel: [5225782.248046]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Mar  8 08:15:45 ubuntu kernel: [5225782.248058]         00 00 00 00
Mar  8 08:15:45 ubuntu kernel: [5225782.248059] sd 0:0:0:0: [sda] 
Mar  8 08:15:45 ubuntu kernel: [5225782.248060] Add. Sense: Unrecovered read error - auto reallocate failed
Mar  8 08:15:45 ubuntu kernel: [5225782.248061] sd 0:0:0:0: [sda] CDB:
Mar  8 08:15:45 ubuntu kernel: [5225782.248062] Write(10): 2a 00 04 30 e0 00 00 00 08 00
Mar  8 08:15:45 ubuntu kernel: [5225782.248065] end_request: I/O error, dev sda, sector 70311936
Mar  8 08:15:45 ubuntu kernel: [5225782.283875] Buffer I/O error on device sda3, logical block 0
Mar  8 08:15:45 ubuntu kernel: [5225782.318909] lost page write due to I/O error on sda3
Mar  8 08:15:45 ubuntu kernel: [5225782.318914] ata1: EH complete
Mar  8 08:15:45 ubuntu kernel: [5225782.318914] EXT4-fs error (device sda3): ext4_journal_start_sb:349: Detected aborted journal
Mar  8 08:15:45 ubuntu kernel: [5225782.319440] EXT4-fs error (device sda3): ext4_journal_start_sb:349: Detected aborted journal
Mar  8 08:15:45 ubuntu kernel: [5225782.319441] EXT4-fs (sda3): Remounting filesystem read-only
Mar  8 08:15:45 ubuntu kernel: [5225782.319939] EXT4-fs error (device sda3): ext4_journal_start_sb:349: Detected aborted journal

Cela se termine avec "EXT4-fs (sda3): Remounting filesystem read-only"

Ce que je ne comprends pas, c'est pourquoi SMARTctl ne vois rien :
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   198   196   051    Pre-fail  Always       -       16743
  3 Spin_Up_Time            0x0027   253   253   021    Pre-fail  Always       -       8266
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       13
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   099   000    Old_age   Always       -       644
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       11
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       8
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       4
194 Temperature_Celsius     0x0022   118   104   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       9
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   198   170   000    Old_age   Offline      -       544

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%       344         -


Les 3 lignes qui ont évoluées depuis le 7 janvier :

  1 Raw_Read_Error_Rate     0x002f   197   196   051    Pre-fail  Always       -       16711
passe à (augmentation de 32)
  1 Raw_Read_Error_Rate     0x002f   198   196   051    Pre-fail  Always       -       16743


  9 Power_On_Hours          0x0032   100   099   000    Old_age   Always       -       352
passe à (ce sont des heures ?? Le disque tourne 24h/24 depuis presque 3ans)
  9 Power_On_Hours          0x0032   100   099   000    Old_age   Always       -       644


197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       10
pass à (diminution de 1)
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       9