INFRASTRUCTURE 
Sommaire Infrastructure
Les disques durs encore peu fiables
Sur plus de 100 000 disques durs testés par Google, 8% ont enregistré une panne dès la deuxième année. Le taux d'utilisation et une température élevée ne sont pas des signes invariables de défaillance.  (22/02/2007)
  En savoir plus
 Disques durs hybrides
 Classement des pertes de données les plus rocambolesques
Dossier Exploitation informatique
En 2002, plus de 90% des nouvelles informations produites étaient stockées sur des supports magnétiques (disques durs en majorité). Une meilleure connaissance de la durée de vie de ces composants pourrait ainsi s'avérer utile pour guider la conception des systèmes de stockage aussi bien que pour concevoir des stratégies de déploiement et d'entretien.

Une température trop élevée et un fort taux d'utilisation sont les critères les plus souvent cités pour expliquer les défaillances. Avec plus de 100 000 disques durs, l'analyse statistique réalisée par Google sur sa propre infrastructure devrait a priori permettre de bénéficier de plus de visibilité. Les seules études portant sur des volumes de cette envergure sont en général l'apanage des constructeurs eux-mêmes, ceux-ci évaluant le taux de panne annuel à moins de 2%. Les rapports utilisateurs font quant à eux plutôt mention d'une valeur supérieure à 6%.

Entre décembre 2005 et août 2006, Google a donc collecté les données de 100 000 disques durs de divers grands constructeurs, en production depuis au plus tard 2001. De neuf modèles principaux, ces disques, pour la plupart grand public, ont des capacités s'échelonnant de 80 à 400 Go et de 5400 ou 7200 tours/minute. Sur ce parc, Google a ainsi analysé le taux de défaillance au cours du temps, tout en recoupant ces données avec le niveau d'utilisation et la température afin de juger de la pertinence ou non de ces critères.

Premier constat, prévisible, les pannes progressent avec l'âge du disque dur. Ainsi au cours de la première année d'utilisation, 1,7% des disques ont dû être remplacés, soit un peu plus de 1 700 d'entre eux. La période critique se situe toutefois au cours des 3 premiers mois durant lesquels 3% rencontrent une défaillance. Le taux grimpe ensuite à 8% pendant la deuxième année et à 8,6% durant la troisième, avant de redescendre à 6% et 7%.

Google juge cependant le critère du modèle comme plus pertinent que l'incidence de l'âge du disque dur pour justifier les pannes. Selon toute vraisemblance, la firme n'a souhaité froisser aucune susceptibilité en ne publiant pas de données relatives aux modèles et aux constructeurs, se bornant ainsi à conclure à des différences significatives.

Plus de pannes sur les disques de moins de 3 ans à basses températures
Quant à l'incidence de l'utilisation, elle s'avère loin d'être flagrante estime Google. Seuls les très jeunes et vieux disques durs montreraient ainsi une corrélation entre taux d'utilisation fort et mortalité accrue. Passée la première année, des disques fortement sollicités ne présentent en effet pas un taux de panne supérieur à ceux faiblement utilisés. Les disques de 3 ans vont même à l'encontre du comportement attendu, à savoir que ce sont ceux dont le taux d'utilisation est le plus élevé qui subissent le moins de défaillances.

La température ne serait pas non plus un élément si déterminant, ou du moins pas dans le sens communément admis. Ainsi les pannes sont plus nombreuses pour les disques durs de moins de 3 ans lorsque les températures sont les plus basses (entre 15 et 30 degrés). Les températures élevées (supérieures à 45 degrés) n'auraient un impact visible que pour les disques les plus anciens. Ce constat pourrait donc indiquer que datacenters et constructeurs de serveurs bénéficient de plus de liberté à l'égard de cette variable, relève le rapport.

  En savoir plus
 Disques durs hybrides
 Classement des pertes de données les plus rocambolesques
Dossier Exploitation informatique
Autre enseignement, le SMART (Self Monitoring Analysis & Reporting Technology) n'est pas la panacée pour prévenir les pannes. En effet, 56% des disques défaillants n'ont fait l'objet d'aucune alerte. Une erreur de surface lors d'un scan permet néanmoins de mieux cibler les disques exposés. Ceux liés à ce type d'alerte présentent ainsi un risque 10 fois supérieur. La réallocation de secteurs est également un symptôme d'une future panne. Toutefois, respectivement 70% et 85% des disques affectés par ces alertes ont survécu les 8 premiers mois qui ont suivi la détection.

 
 
Christophe AUFFRAY, JDN Solutions Sommaire Infrastructure
 
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters