Les indicateurs SMART des disques durs

Les indicateurs SMART pourront vous aider à prévoir une future panne et donc, prendre des précautions vis-à-vis de vos données sauvegardées.

1 commentaire Donner une note à l'article (5)

Article lu   fois.

L'auteur

Profil ProSite personnel

Liens sociaux

Viadeo Twitter Facebook Share on Google+   

I. Introduction

Depuis 2004, les disques durs peuvent intégrer des indicateurs S.M.A.R.TSelf-Monitoring, Analysis and Reporting Technology. Cette technologie permet la surveillance du disque dur d'un ordinateur. En effet, le disque dur intègre un micro-logiciel qui, en plus de gérer le mécanisme interne du périphérique de stockage, est aussi capable de rapporter des informations sur le bon fonctionnement et l'usure du support.

II. Connaître les informations SMART d'un disque

II-A. Linux

II-A-1. Interface graphique

La majorité des distributions Linux offrent par défaut les outils pour connaître l'état de son disque. On retrouvera l'outil approprié dans le menu « Système » → « Utilitaire de disque ». Immédiatement, vous pourrez avoir un diagnostic de la santé du disque (sain ou non). Évidemment, vous pouvez aussi connaître le détail des informations en cliquant sur « Données SMART ».

Image non disponible

II-A-2. En ligne de commande

En plus de l'interface graphique, vous pouvez retrouver Smartmontools qui permet d'afficher les données SMART dans la console. Celui-ci fournit la commande : smartctl. Vous pouvez récupérer l'intégralité des indicateurs avec la commande :

 
Sélectionnez
smartcl -a /dev/sda

où /dev/sda représente votre disque dur.

II-B. Windows

Il existe une interface graphique pour smartctl sous Windows : HDD Guardian. L'outil SpeedFan, utile pour obtenir des informations sur la température du système et la vitesse des ventilateurs, permet aussi de lire les indicateurs SMART.

Image non disponible
Interface de HDD Guardian

II-C. Mac OS X

L'utilitaire de disque du système d'exploitation permet de lire les indicateurs SMART.

Image non disponible

II-D. Alternative

Sachant que les distributions Linux embarquent un outil pour lire les données, vous pouvez toujours utiliser un live CD (par exemple Ubuntu) pour diagnostiquer votre système.

III. Lire les données

III-A. Tester le disque

Afin d'avoir des valeurs SMART à jour (ou non nulles), il est nécessaire de faire le test automatique. Pour avoir le plus d'informations possibles, n'hésitez pas à faire un test étendu/complet.

Celui-ci peut prendre quelques dizaines de minutes (voire des heures), mais il est toujours possible d'utiliser le PC pendant son exécution.

III-B. Analyser les données

Les données SMART sont généralement présentées à travers un tableau. Chaque information s'appelle un attribut et décrit un aspect de l'usure du disque. Le tableau indique les informations suivantes :

  • l'identifiant de l'attribut ;
  • l'attribut (description) ;
  • la valeur actuelle ;
  • la valeur normalisée ;
  • le seuil ;
  • la pire valeur rencontrée pour cette information ;
  • le type d'information ;
  • le type de mise à jour ;
  • l'estimation.

En réalité, chaque attribut n'expose que trois valeurs, les autres sont rajoutées par le logiciel afin de donner une indication améliorée. Ces trois valeurs sont :

  • la valeur normalisée. 0 indique un mauvais état et le maximum que tout va bien. Le maximum n'est pas toujours le même suivant l'attribut et peut être 100, 200 ou 253 ;
  • le seuil : la limite minimale pour la valeur normalisée. Si la valeur dépasse le seuil, le disque est considéré défectueux ;
  • la valeur brute : la valeur renvoyée par le périphérique avant toute normalisation.

Le type d'information indique l'utilité de l'attribut : prédire une panne ou si le disque dur arrive en fin de vie.

L'estimation est liée au dépassement du seuil.

III-C. Interpréter les indications

Les données SMART permettent d'avoir des informations précises sur le disque. Notamment, il est intéressant de connaître le nombre de secteurs défaillants ou ré-alloués. Toutefois, la valeur la plus importante de toutes est le nombre de secteurs incorrigibles. En effet, il peut y avoir des secteurs ayant des défaillances mais qui seront remplacés par d'autres (zone de réserve). Alors que les secteurs incorrigibles sont définitivement morts.

Même avec des secteurs endommagés, le disque dur peut fonctionner. En effet, le contrôleur du disque peut simplement boycotter les secteurs endommagés et ainsi continuer d'assurer le bon fonctionnement du disque. Toutefois, si les secteurs corrompus augmentent, il devient intéressant de préparer son remplacement (et sa sauvegarde).

Aussi, à travers SMART, vous pouvez connaître l'usure du disque (nombre d'erreurs de lecture) ou encore si le disque commence à fonctionner au ralenti (temps de démarrage du disque).

Les données SMART sont fournies afin de permettre de prévoir les pannes. Ainsi, si un seuil est dépassé et que le disque montre des faiblesses, il ne faut pas paniquer, mais prendre ses précautions (sauvegardes).

III-C-1. Description des attributs

Statuts critique du périphérique

Compteur de secteurs ré-alloués

Nombre de secteurs défectueux qui ont pu être ré-alloués grâce aux secteurs de rechange. Une valeur basse et sans autre problème rapporté peut être due à un problème de la surface du disque.

Nombre de secteurs en attente

Nombre de secteurs pouvant être défectueux, mais qui nécessitent une analyse approfondie. Dans certains cas, il n'y aura pas de ré-allocation si finalement le secteur est bon. Un outil de test hors ligne du disque permettra de vérifier ces secteurs et de les traiter de manière appropriée.

Compteur de secteurs non corrigibles, hors ligne

Nombre de secteurs défectueux détectés par un outil de test hors ligne.

Taux d'erreur de lecture

Indication du taux d'apparition de ces événements. Si ces taux augmentent, le disque doit être surveillé.

Taux de nouvelle tentative suite à une erreur de lecture

Taux d'erreur d'écriture

Taux d'erreur de recherche/déplacement

Tentatives de re-calibration

Indication du nombre de re-calibrations échouées au premier essai.

Temps de mise en rotation

Avec l'âge, le temps peut augmenter. Aussi, cela peut indiquer une défaillance du contrôleur ou du matériel.

Temps de nouvelle tentative de mise en rotation

Incrémenté chaque fois que le disque n'a pas pu atteindre sa vitesse de fonctionnement en un temps imparti. Peut indiquer un problème d'alimentation (alimentation sous dimensionnée) ou, comme pour le temps de démarrage, une défaillance.

Information sur la durée de vie

Compteur de démarrages/arrêts

Estimation de l'utilisation. Les constructeurs de disque estiment la durée de vie d'un disque en se basant sur ses valeurs. Si le disque dépasse le seuil, ce n'est pas qu'il est inutilisable ou défectueux, mais que le constructeur conseille de le remplacer, car trop vieux.

Compteur de retraits et d'extinctions

Heures en charge/activité

Indication similaire à celle ci-dessus. Ces valeurs peuvent être des heures, demi-heures ou autre suivant le constructeur.

Heures de survol des têtes

Information sur les conditions opératoires

Température

 

Taux d'erreur Ultra-DMA (UDMA) CRC

Indication d'erreurs liées à la connectique. En effet, les transferts entre le disque et le reste de la machine sont soumis à un test CRC et ce compteur indique si le test échoue.
Après changement d'un câble défectueux, la valeur retourne à la normale.

Taux d'erreurs G-Sense

Indication des erreurs survenues à cause d'un choc. Le compteur est principalement présent sur les disques 2,5 pouces (PC portable). Une fois le choc terminé, il est possible que ce compteur revienne à la normale.

Vous pouvez trouver la liste de tous les attributs SMART sur Wikipedia.

IV. Réparer les secteurs défectueux

En utilisant smartctl en ligne de commande, vous pourrez connaître la liste des secteurs défectueux. Ensuite, grâce à hdparm, vous pourrez lire et réécrire un secteur. La réécriture d'un secteur défectueux provoque sa réallocation.

Aussi, vous pouvez utiliser l'outil badblocks avec l'option -nvs afin de corriger les secteurs automatiquement.

V. Dans tous les cas

Dans tous les cas, sauvegardez régulièrement vos données. Vous n'êtes jamais à l'abri d'une panne et les données SMART ne vont pas vous en prévenir. Les informations SMART sont là pour vous aider à prédire les dysfonctionnements.

VI. Liens

VII. Remerciements

Merci à milkoseck et chrtophe.

Merci aussi à ced pour sa relecture orthographique.

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

  

Les sources présentées sur cette page sont libres de droits et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation constitue une œuvre intellectuelle protégée par les droits d'auteur. Copyright © 2016 Alexandre Laurent. Aucune reproduction, même partielle, ne peut être faite de ce site et de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.