I. Introduction▲
Depuis 2004, les disques durs peuvent intégrer des indicateurs S.M.A.R.TSelf-Monitoring, Analysis and Reporting Technology. Cette technologie permet la surveillance du disque dur d'un ordinateur. En effet, le disque dur intègre un micro-logiciel qui, en plus de gérer le mécanisme interne du périphérique de stockage, est aussi capable de rapporter des informations sur le bon fonctionnement et l'usure du support.
II. Connaître les informations SMART d'un disque▲
II-A. Linux▲
II-A-1. Interface graphique▲
La majorité des distributions Linux offrent par défaut les outils pour connaître l'état de son disque. On retrouvera l'outil approprié dans le menu « Système » → « Utilitaire de disque ». Immédiatement, vous pourrez avoir un diagnostic de la santé du disque (sain ou non). Évidemment, vous pouvez aussi connaître le détail des informations en cliquant sur « Données SMART ».
II-A-2. En ligne de commande▲
En plus de l'interface graphique, vous pouvez retrouver Smartmontools qui permet d'afficher les données SMART dans la console. Celui-ci fournit la commande : smartctl. Vous pouvez récupérer l'intégralité des indicateurs avec la commande :
smartctl -a /dev/sda
où /dev/sda représente votre disque dur.
II-B. Windows▲
Il existe une interface graphique pour smartctl sous Windows : HDD Guardian. L'outil SpeedFan, utile pour obtenir des informations sur la température du système et la vitesse des ventilateurs, permet aussi de lire les indicateurs SMART.
II-C. Mac OS X▲
L'utilitaire de disque du système d'exploitation permet de lire les indicateurs SMART.
II-D. Alternative▲
Sachant que les distributions Linux embarquent un outil pour lire les données, vous pouvez toujours utiliser un live CD (par exemple Ubuntu) pour diagnostiquer votre système.
III. Lire les données▲
III-A. Tester le disque▲
Afin d'avoir des valeurs SMART à jour (ou non nulles), il est nécessaire de faire le test automatique. Pour avoir le plus d'informations possibles, n'hésitez pas à faire un test étendu/complet.
Celui-ci peut prendre quelques dizaines de minutes (voire des heures), mais il est toujours possible d'utiliser le PC pendant son exécution.
III-B. Analyser les données▲
Les données SMART sont généralement présentées à travers un tableau. Chaque information s'appelle un attribut et décrit un aspect de l'usure du disque. Le tableau indique les informations suivantes :
- l'identifiant de l'attribut ;
- l'attribut (description) ;
- la valeur actuelle ;
- la valeur normalisée ;
- le seuil ;
- la pire valeur rencontrée pour cette information ;
- le type d'information ;
- le type de mise à jour ;
- l'estimation.
En réalité, chaque attribut n'expose que trois valeurs, les autres sont rajoutées par le logiciel afin de donner une indication améliorée. Ces trois valeurs sont :
- la valeur normalisée. 0 indique un mauvais état et le maximum que tout va bien. Le maximum n'est pas toujours le même suivant l'attribut et peut être 100, 200 ou 253 ;
- le seuil : la limite minimale pour la valeur normalisée. Si la valeur dépasse le seuil, le disque est considéré défectueux ;
- la valeur brute : la valeur renvoyée par le périphérique avant toute normalisation.
Le type d'information indique l'utilité de l'attribut : prédire une panne ou si le disque dur arrive en fin de vie.
L'estimation est liée au dépassement du seuil.
III-C. Interpréter les indications▲
Les données SMART permettent d'avoir des informations précises sur le disque. Notamment, il est intéressant de connaître le nombre de secteurs défaillants ou ré-alloués. Toutefois, la valeur la plus importante de toutes est le nombre de secteurs incorrigibles. En effet, il peut y avoir des secteurs ayant des défaillances mais qui seront remplacés par d'autres (zone de réserve). Alors que les secteurs incorrigibles sont définitivement morts.
Même avec des secteurs endommagés, le disque dur peut fonctionner. En effet, le contrôleur du disque peut simplement boycotter les secteurs endommagés et ainsi continuer d'assurer le bon fonctionnement du disque. Toutefois, si les secteurs corrompus augmentent, il devient intéressant de préparer son remplacement (et sa sauvegarde).
Aussi, à travers SMART, vous pouvez connaître l'usure du disque (nombre d'erreurs de lecture) ou encore si le disque commence à fonctionner au ralenti (temps de démarrage du disque).
Les données SMART sont fournies afin de permettre de prévoir les pannes. Ainsi, si un seuil est dépassé et que le disque montre des faiblesses, il ne faut pas paniquer, mais prendre ses précautions (sauvegardes).
III-C-1. Description des attributs▲
Statuts critique du périphérique |
|
Compteur de secteurs ré-alloués |
Nombre de secteurs défectueux qui ont pu être ré-alloués grâce aux secteurs de rechange. Une valeur basse et sans autre problème rapporté peut être due à un problème de la surface du disque. |
Nombre de secteurs en attente |
Nombre de secteurs pouvant être défectueux, mais qui nécessitent une analyse approfondie. Dans certains cas, il n'y aura pas de ré-allocation si finalement le secteur est bon. Un outil de test hors ligne du disque permettra de vérifier ces secteurs et de les traiter de manière appropriée. |
Compteur de secteurs non corrigibles, hors ligne |
Nombre de secteurs défectueux détectés par un outil de test hors ligne. |
Taux d'erreur de lecture |
Indication du taux d'apparition de ces événements. Si ces taux augmentent, le disque doit être surveillé. |
Taux de nouvelle tentative suite à une erreur de lecture |
|
Taux d'erreur d'écriture |
|
Taux d'erreur de recherche/déplacement |
|
Tentatives de re-calibration |
Indication du nombre de re-calibrations échouées au premier essai. |
Temps de mise en rotation |
Avec l'âge, le temps peut augmenter. Aussi, cela peut indiquer une défaillance du contrôleur ou du matériel. |
Temps de nouvelle tentative de mise en rotation |
Incrémenté chaque fois que le disque n'a pas pu atteindre sa vitesse de fonctionnement en un temps imparti. Peut indiquer un problème d'alimentation (alimentation sous dimensionnée) ou, comme pour le temps de démarrage, une défaillance. |
Information sur la durée de vie |
|
Compteur de démarrages/arrêts |
Estimation de l'utilisation. Les constructeurs de disque estiment la durée de vie d'un disque en se basant sur ses valeurs. Si le disque dépasse le seuil, ce n'est pas qu'il est inutilisable ou défectueux, mais que le constructeur conseille de le remplacer, car trop vieux. |
Compteur de retraits et d'extinctions |
|
Heures en charge/activité |
Indication similaire à celle ci-dessus. Ces valeurs peuvent être des heures, demi-heures ou autre suivant le constructeur. |
Heures de survol des têtes |
|
Information sur les conditions opératoires |
|
Température |
|
Taux d'erreur Ultra-DMA (UDMA) CRC |
Indication d'erreurs liées à la connectique. En effet, les transferts entre le disque et le reste de la machine sont soumis à un test CRC et ce compteur indique si le test échoue. |
Taux d'erreurs G-Sense |
Indication des erreurs survenues à cause d'un choc. Le compteur est principalement présent sur les disques 2,5 pouces (PC portable). Une fois le choc terminé, il est possible que ce compteur revienne à la normale. |
Vous pouvez trouver la liste de tous les attributs SMART sur Wikipedia.
IV. Réparer les secteurs défectueux▲
En utilisant smartctl en ligne de commande, vous pourrez connaître la liste des secteurs défectueux. Ensuite, grâce à hdparm, vous pourrez lire et réécrire un secteur. La réécriture d'un secteur défectueux provoque sa réallocation.
Aussi, vous pouvez utiliser l'outil badblocks avec l'option -nvs afin de corriger les secteurs automatiquement.
V. Dans tous les cas▲
Dans tous les cas, sauvegardez régulièrement vos données. Vous n'êtes jamais à l'abri d'une panne et les données SMART ne vont pas vous en prévenir. Les informations SMART sont là pour vous aider à prédire les dysfonctionnements.
VI. Liens▲
- Page Wikipedia sur la liste des outils pouvant récupérer les informations SMART ;
- Page Wikipedia sur la description des attributs.