La Fibre

Datacenter et équipements réseaux => Équipements réseaux => Matériel informatique Matériel informatique (réseaux domestiques) => Discussion démarrée par: vivien le 08 août 2007 à 13:30:10

Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: vivien le 08 août 2007 à 13:30:10
La méthode pour garantir des temps de réponses plus corrects de nos jours c'est les mises en Raid 0 ou Raid 1 minimum.

Euh le Raid 1 tu augmente pas du tout les temps de réponses, tu augmente la sécuritée.

Le raid 0, ok tu augmente le temps de réponse mais a ne pas utiliser si ce ne sont pas des grapes de disque raid 0 eux même en raid 1 (4 disques quoi)

Le seul vrai moyen c'est le raid 5 mais il est verai que la carte coute un peu cher....

+ d'infos : https://fr.wikipedia.org/wiki/RAID_%28informatique%29

Pour vos cas le moyen le + simple c'est un vieux PC  qui va servir à faire du P2P. Pour rappel amule peut se suffire d'un PC sans écran et sans interface graphique et se commander a distance. Un vieux PII avec 128 Mo ram et beaucoup de disque sous linux le ferra bien fonctionner.
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: feyb64 le 09 août 2007 à 00:36:05
Euh le Raid 1 tu augmente pas du tout les temps de réponses, tu augmente la sécuritée.

Le raid 0, ok tu augmente le temps de réponse mais a ne pas utiliser si ce ne sont pas des grapes de disque raid 0 eux même en raid 1 (4 disques quoi)

Le seul vrai moyen c'est le raid 5 mais il est verai que la carte coute un peu cher....


Tu as raison sur le RAID 0 plus rapide que RAID1, mais en écriture seulement, car en lecture c'est quif-quif étant donné que l'os fait du 'load-balancing' entre les deux disques dans les deux cas.

Par contre pas d'accord avec le RAID5, il est TOUJOURS plus lent en ecriture que tous les autres même avec une carte RAID calculant elle même les 'parités', à moins d'avoir la carte RAID5 qui 'tue', mais à quel prix  :P plsu un minimum de 3 disques.

Quand on a deux disques et pas de 'sauvegarde' complète possible facilement, je préconise cependant de faire du Raid 1 si on a que deux disques, histoire d'avoir une 'sécurité' des datas. On gagne au moins en lecture.
Si effectivement tu peux acheter 4 disques, la solution vitesse + sécurité est effectivement RAID 0+1.
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: vivien le 09 août 2007 à 10:14:00
Par contre pas d'accord avec le RAID5, il est TOUJOURS plus lent en ecriture que tous les autres même avec une carte RAID calculant elle même les 'parités', à moins d'avoir la carte RAID5 qui 'tue', mais à quel prix  :P plsu un minimum de 3 disques.

En RAID 5, si on prend un exemple a 6 disques (ce que j'ai mis en place pour mon job), tu écrit 1/5 du fichier sur chaque disque donc tu vas beaucoup plus vite qu'avec un unique disque.

De plus les accés en écriture son optimisé et sont fait par la carte RAID en arrière plan car la plupart des cartes RAID intégre un cache via de la RAM. Ce cache est alimenté par une baterie spécifique a la carte RAID (quand le PC s'éteind, si tout n'est pas écrit sur les disque ce sera fait au prochain démarage)
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: feyb64 le 10 août 2007 à 18:39:10
En RAID 5, si on prend un exemple a 6 disques (ce que j'ai mis en place pour mon job), tu écrit 1/5 du fichier sur chaque disque donc tu vas beaucoup plus vite qu'avec un unique disque.

De plus les accés en écriture son optimisé et sont fait par la carte RAID en arrière plan car la plupart des cartes RAID intégre un cache via de la RAM. Ce cache est alimenté par une baterie spécifique a la carte RAID (quand le PC s'éteind, si tout n'est pas écrit sur les disque ce sera fait au prochain démarage)

OK si tu as 6 disques et une excellente carte RAID5, mais les deux conditions sont rarement atteintes par le user lambda  ::)
les cartes RAID 5 'basic' n'ont ni cache (ou si peu le temps de calculer checksum) ni batterie  :-X
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: TITI le 11 août 2007 à 09:18:08
la dernière version utorrent fait tout ramer... Meme la navigation, défois pendant 5 secondes sur les sites j'ai "Connexion à domaine.com...". Défois ca perd meme la connexion... :s
Et la mémoire bouffé :s, va voir si c'est pas un PB avec Vista ! Mais sur le forum officiel j'ai pas vu grand chose.

Et meme si je ne DL/UP pas sur utorrent, mon débit est limité quand je prend un fichier en http, et dès que je ferme utorrent le barrage s'ouvre !
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: le 12 août 2007 à 21:23:34
je suis en raid 0 et ça rame quand même. C'est pas non plus insurmontable. Dans moniteurs de ressources je vois bien que la ram et les disques durs sont malmenés niv activités avec les graphs.
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: vivien le 18 mai 2008 à 11:58:11
OK si tu as 6 disques et une excellente carte RAID5, mais les deux conditions sont rarement atteintes par le user lambda  ::)
les cartes RAID 5 'basic' n'ont ni cache (ou si peu le temps de calculer checksum) ni batterie  :-X

Un type de pb que l'on peut avoir avec le RAID 5 :

C’est la technologie généralement livrée avec les serveurs. Il faut au minimum 3 disques physiques et en cas de panne d’un disque, les informations de ce disque peuvent être reconstituées à partir des parités contenues dans les n-1 disques. Ce système semble sécuritaire et plus économique mais en réalité, il est très rare que toutes les données d'un volume soient lues régulièrement.  Il est donc très probable que des défauts tels que les secteurs illisibles ne soient pas détectés pendant une très longue période. Lorsque l'un des disques devient réellement défectueux, la reconstruction nécessite de parcourir l'intégralité des disques restants. On peut alors tomber sur des défauts qui étaient restés invisibles jusque là. À ce moment là, 2 disques sont considérés défaillants simultanèment et le volume RAID 5 devient inutilisable. Il est alors extrêmement difficile, voire impossible, de récupérer les données.

A noter que si tous les disques sont de la même série, ils peuvent tomber en panne les un a la suite des autres dan un interval très court.
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: willemijns le 19 mai 2008 à 14:28:50
Il est donc très probable que des défauts tels que les secteurs illisibles ne soient pas détectés pendant une très longue période.

à cause des effets tampons (mémoire cache) des controleurs de HD ?
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: vivien le 19 mai 2008 à 19:12:02
Il est donc très probable que des défauts tels que les secteurs illisibles ne soient pas détectés pendant une très longue période => tout simplement car le disque est a moitié vide.

Si tu n'utilise pas car (il te reste beaucoup de place sur ton dd) une partie de celui-ci, il est possible qu'un incident se déclare sur cettte partie.

La reconstruction du RAID est faite binairement. La carte contrôleur ne sait pas si la partie du disque est utilisée ou pas. (elle ne sait pas si tu utilisesun système de fichier en FAT, NTFS, EXT3, ReiserFS, ...) elle recopie donc binairement. Quand elle rencontrera l'erreur le disque en question sera déclaré HS d'où impossibilité de continuer.

Je pense qu'il est possible avec certaines cartes de sauter les erreurs mais tu ne sais pas si tu vas récupérer tes données. Tu sait qu'une partie du disque na pas été recopiée sans savoir si c'est des données ou du vide.

Un exemple vrai des pb du raid :

Citer
Nous avons un grave probleme sur le filesysteme 197. Le systeme est monté sur un RAID-10 de 12 disques (basés sur 4 raid-1 de 3 disques chacun). Il se trouve que le filesysteme a enregistré les erreurs sur 2 raid-1 (soit 6 disques !).

root@filerz3:~# zpool status -x
pool: filer197
state: FAULTED
status: The pool metadata is corrupted and the pool cannot be opened.
action: Destroy and re-create the pool from a backup source.
see: http://www.sun.com/msg/ZFS-8000-CS (http://www.sun.com/msg/ZFS-8000-CS)
scrub: none requested
config:

NAME STATE READ WRITE CKSUM
filer197 FAULTED 0 0 4 corrupted data
mirror ONLINE 0 0 0
c1t20d0 ONLINE 0 0 0
c1t21d0 ONLINE 0 0 0
c1t22d0 ONLINE 0 0 0
mirror ONLINE 0 0 2
c1t23d0 ONLINE 0 0 4
c1t24d0 ONLINE 0 0 4
c1t25d0 ONLINE 0 0 4
mirror ONLINE 0 0 2
c1t26d0 ONLINE 0 0 4
c1t27d0 ONLINE 0 0 4
c1t28d0 ONLINE 0 0 4
mirror ONLINE 0 0 0
c1t29d0 ONLINE 0 0 0
c1t30d0 ONLINE 0 0 0
c1t31d0 ONLINE 0 0 0

Nous avons sortis les disques sur un autre filer pour travailer sur ces disques afin de voir si on peut recuperer les données ou c'est foutu et on doit travailer à partir du backup (daté de ce dimanche).

Source : http://travaux.ovh.com/?do=details&id=2169 (http://travaux.ovh.com/?do=details&id=2169)

Pourtant le RAID 10 est très fiable : "Sa fiabilité est assez grande puisqu'il faut que tous les éléments d'une grappe soient défectueux pour entraîner un défaut global. La reconstruction est assez performante puisqu'elle ne mobilise que les disques d'une seule grappe et non la totalité." https://fr.wikipedia.org/wiki/RAID_(informatique) (https://fr.wikipedia.org/wiki/RAID_(informatique))

OVH a pour ce Filer 12 disques.

Chaque information est recopiée 3 fois dans chaque grappe sur chacun des disques.

Si on prend l'exemple de 12 disques de 500 GO, nous n'avons pas une capacitée de 6 To mais de 2 To. Chacune des 4 grappes contient 3 disques identique. Nous pouvons donc avoir 2 disques dans chaque grappe HS (soit 8 disques au total) sans problèmes. Par contre si une grappe a ses 3 disques HS en même temps on pert tout,
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: willemijns le 20 mai 2008 à 13:16:26
Si tu n'utilise pas car (il te reste beaucoup de place sur ton dd) une partie de celui-ci, il est possible qu'un incident se déclare sur cettte partie.

ok mais bon en FAT32 par exemple, je sais qu'un secteur qui a ete été utilisé etait souvent rarement utilisé après enfin
bien sur cela n'est pas ancré dans les specs mais la "réalité du térrain" faisait que sous des OS FAT16/FAT32 le defrag etait souvent utilisé :)
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: vivien le 20 mai 2008 à 18:51:59
Sur des serveurs le defrag n'est jamais réalisé.

Bien que les système de fichier moderne ont moins besoin de défrag car le système place les fichiers de manière optimale (pas a la suite mais dans le + grand trou), on a de la fragmentation surtout si le système de fichier est presque plein (d'ailleurs EXT3 réserve par default 5% pour éviter justement qu'il ne dépasse 95% de remplissage ce qui est problématique pour la fragmentation)

On est complètement hors sujet....
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: feyb64 le 22 mai 2008 à 22:28:57
...
On est complètement hors sujet....

Absolutly  ;D

[HS]
Mais tant qu'on y ai :

...
Je pense qu'il est possible avec certaines cartes de sauter les erreurs mais tu ne sais pas si tu vas récupérer tes données. Tu sait qu'une partie du disque na pas été recopiée sans savoir si c'est des données ou du vide.
...

C'est normalement 'déjà' fait au niveau des disques SCSI 'haut de gamme' depuis longue date : ils intègrent eux même des pistes de 'spare' individuellement et remplacent à la volée sans intervention du controleur ni de l'os.
La première erreur secteur sur ces disques remontée à la carte controleur et à l'os, intervient alors lorsque le disque lui même n'a plus de place dans son 'spare'.
Normalement les disques de 'maintenant' intègrent pour la plupard cette fonctionnalité (en particulier ceux pour les serveurs, scsi, sas). Il ne faut juste pas voir que le 'prix' ...

Il est donc très probable que des défauts tels que les secteurs illisibles ne soient pas détectés pendant une très longue période => tout simplement car le disque est a moitié vide.

D'où l'importance de tests 'réguliers' de la surface :)
Ce n'est pas parce qu'on est en 'RAID' qu'il faut se croire à l'abris  ::)
Ceci est encore plus vrai quand je vois des installs RAID et des sauvegardes des plus 'bancales' ou pas du tout en pensant que le 'RAID' nous sauve  ::)

Les principes fondamentaux du RAID :
- une BONNE installation de RAID, c'est DEJA PREVOIR au moins UN DISQUE DE SPARE en permanence dans la machine, afin que l'on ne reste pas même quelques heures sans 'RAID'. Car le cas de disques de la même série qui tombent en panne 'en série' justement n'est pas à négliger.
- Puisqu'on a du 'spare', de temps à autre on l'active, pour pouvoir scanner le remplacé, qu'on remet ensuite en 'spare' (rotation de l'usage des disques), ce qui évite aussi de se retrouver avec un 'spare' défectueux  :'(
- un RAID n'est pas un moyen de 'délaisser' des sauvegardes rondement menées et contrôlées (plusieurs jeux tournants sur plusieurs semaines voir mois, ...)
Nombre de gens ne font alors avec du 'raid' que des sauvegardes 'quand j'y pense', ou ne les contrôlent plus vraiment (quand automatisées) jsute regardant 'ok', sans jamais les 'tester' pensant que le 'raid' est là pour les sauver (manque de bol, le raid est hs et irréparable, et les sauvegardes aussi ...)
- un RAID n'est rien d'autre qu'un tas de 'disques', il y a donc lieu de contrôler individuellement ces disques régulièrement (scans surfaces, ...) pour éviter les désagrements de pannes en cascades ou le pb 'erreur hard secteur avec plus de 'spare' interne aux disques'.
- Il faut aussi configurer les outils de contrôle du RAID et de prévention et alertes pour interroger les disques sur leur état interne afin d'avoir justement ce genre de remontés préventives (système S.M.A.R.T. hard disk status and hard disk failure prevention, que les disques modernes intégrent 'presque tous') et les remplacer à la première alerte plutôt qu'attendre 'trop tard' ...
(ce dernier point est aussi valable chez soi même sans 'raid'  ;) )

...
Un exemple vrai des pb du raid :

Source :

Pourtant le RAID 10 est très fiable : "Sa fiabilité est assez grande puisqu'il faut que tous les éléments d'une grappe soient défectueux pour entraîner un défaut global. La reconstruction est assez performante puisqu'elle ne mobilise que les disques d'une seule grappe et non la totalité." https://fr.wikipedia.org/wiki/RAID_(informatique) (https://fr.wikipedia.org/wiki/RAID_(informatique))

OVH a pour ce Filer 12 disques.

Chaque information est recopiée 3 fois dans chaque grappe sur chacun des disques.

Si on prend l'exemple de 12 disques de 500 GO, nous n'avons pas une capacitée de 6 To mais de 2 To. Chacune des 4 grappes contient 3 disques identique. Nous pouvons donc avoir 2 disques dans chaque grappe HS (soit 8 disques au total) sans problèmes. Par contre si une grappe a ses 3 disques HS en même temps on pert tout,

Auraient ils oublié une étape dans les 'principes fondamentaux du RAID ' ?


Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: vivien le 22 mai 2008 à 23:36:30
C'est normalement 'déjà' fait au niveau des disques SCSI 'haut de gamme' depuis longue date : ils intègrent eux même des pistes de 'spare' individuellement et remplacent à la volée sans intervention du controleur ni de l'os.

Pour moi c'est le cas de tous les disque depuis plusieurs années (c'est pour cela qu'aujourd'hui on ne voit plus les cluster défectueux : ils sont cachés)

Comment vérifier que votre disque est en bon état ?

1/ démarez un live CD Ubuntu-8.04

2/ tapez apt install smartmontools en ligne de commande

3/ tapez smartctl -a /dev/sda en ligne de commande

Vous avez un rapport de ce type :

Citer
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   119   119   024    Pre-fail  Always       -       313 (Average 316)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       23
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   099   099   000    Old_age   Always       -       10588
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       23
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       463
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       463
194 Temperature_Celsius     0x0002   166   166   000    Old_age   Always       -       36 (Lifetime Min/Max 17/47)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       0


Paramètres critiques (ils doivent être a 0 si tout va bien) :

05 Reallocated Sectors Count Nombre de secteurs réalloués. Quand le disque dur obtient une erreur de lecture/écriture/vérification sur un secteur, il note ce secteur comme réalloué et transfère les données vers une zone réservée spéciale (la zone de réserve). Ce processus est aussi connu sous le nom de remapping et les secteurs réalloués sont appelés remaps. C'est pourquoi, sur les disques modernes, on ne peut pas voir de "mauvais" blocs lorsqu'on teste la surface du disque (tous les mauvais secteurs sont cachés dans les secteurs réalloués). Cependant, plus il y a de secteurs réalloués, plus la vitesse d'écriture/lecture diminue.

196 Reallocation Event Count Nombre d'opérations de réallocation (remap). La valeur brute de cet attribut est le nombre total de tentatives de transfert de données entre un secteur réalloué et un secteur de réserve. Les essais fructueux et les échecs sont tous comptés au même titre.

197 Current Pending Sector Count Nombre de secteurs "instables" (en attente de réallocation). Quand des secteurs instables sont lus avec succès, cette valeur est diminuée. Si des erreurs se produisent à la lecture d'un secteur, le disque va tenter de récupérer les données, puis de les transférer vers la zone de réserve et va marquer le secteur comme réalloué.

198 Uncorrectable Sector Count Nombre total d'erreurs incorrigibles à la lecture/écriture d'un secteur. Une augmentation de cette valeur indique des défauts de la surface du disque et/ou des problèmes avec le sous-système mécanique.

220 Disk Shift Distance de laquelle le disque est déplacé par rapport à son axe de rotation (habituellement à cause des chocs). L'unité de mesure est inconnue.

Voila, c'est un résumé simplifié pour voir si son disque est en bon état.

Exemple de disque en mauvais état :

Citer
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027   225   224   063    Pre-fail  Always       -       10762
  4 Start_Stop_Count        0x0032   252   252   000    Old_age   Always       -       3092
  5 Reallocated_Sector_Ct   0x0033   251   250   063    Pre-fail  Always       -       29
  6 Read_Channel_Margin     0x0001   253   253   100    Pre-fail  Offline      -       0
  7 Seek_Error_Rate         0x000a   253   252   000    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0027   249   228   187    Pre-fail  Always       -       35882
  9 Power_On_Minutes        0x0032   216   216   000    Old_age   Always       -       1058h+08m
 10 Spin_Retry_Count        0x002b   253   252   157    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   246   246   000    Old_age   Always       -       3097
192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   253   253   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0032   253   253   000    Old_age   Always       -       29
195 Hardware_ECC_Recovered  0x000a   252   252   000    Old_age   Always       -       36094
196 Reallocated_Event_Count 0x0008   250   250   000    Old_age   Offline      -       3
197 Current_Pending_Sector  0x0008   253   253   000    Old_age   Offline      -       7
198 Offline_Uncorrectable   0x0008   252   252   000    Old_age   Offline      -       1
199 UDMA_CRC_Error_Count    0x0008   199   199   000    Old_age   Offline      -       0
200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age   Always       -       0
202 TA_Increase_Count       0x000a   253   077   000    Old_age   Always       -       1
203 Run_Out_Cancel          0x000b   253   252   180    Pre-fail  Always       -       102
204 Shock_Count_Write_Opern 0x000a   253   252   000    Old_age   Always       -       0
205 Shock_Rate_Write_Opern  0x000a   253   252   000    Old_age   Always       -       0
207 Spin_High_Current       0x002a   253   252   000    Old_age   Always       -       0
208 Spin_Buzz               0x002a   253   252   000    Old_age   Always       -       0
209 Offline_Seek_Performnce 0x0024   120   120   000    Old_age   Offline      -       0
 99 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -       0
100 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -       0
101 Unknown_Attribute       0x0004   253   253   000    Old_age   Offline      -       0

Sinon nous avons des paramètres intéressants :

04 Start/Stop Count Décompte des cycles de mise en rotation (démarrage/arrêt).

09 Power-On Hours (POH) Nombre d'heures de fonctionnement

12 Device Power Cycle Count Cet attribut indique le nombre total de cycles marche/arrêt complets du disque

194 Temperature_Celsius Sa température actuelle en °
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: feyb64 le 23 mai 2008 à 22:48:49
A noter que ces 'smartmotools' sont dispos pour toutes plateformes :

http://smartmontools.sourceforge.net/

Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: willemijns le 01 juin 2008 à 20:19:46
bon gros féfé que je suis, j'ai trouvé ca sous windows

http://hddguru.com/content/en/software/2006.01.22-HDDScan/
www.hdtune.com

je prefere le second...
Titre: Le Raid : améliorer les performances disque ou la sécuritée des données
Posté par: feyb64 le 02 juin 2008 à 22:45:46
Pour le second, leur site est 'hyper lent' ...
Ils n'auraient pas un pb de disque ? LOL

A côté de ça, ces deux sont certe 'free', mais je suis quand même plus attiré par ceux 'open source'  ;)