Que signifie aujourd’hui une panne informatique pour une entreprise ? Une perte immédiate de chiffre d’affaires, des clients mécontents, une image écornée, une sécurité en péril… Et plus l’informatique prend une part importante dans l’activité, plus les systèmes sont interconnectés, et plus les risques augmentent ! Dans ce contexte, il n’est plus question de colmater les brèches grâce aux exploits quotidiens de techniciens dévoués. Il est temps pour la maintenance informatique de se hisser à la hauteur des enjeux et d’entrer, comme l’industrie, dans l’ère du prédictif.
Déterminer le coût réel d’une interruption de service dans le data center est un exercice délicat car la perturbation qu’elle engendre se propage aussitôt dans toute l’entreprise, désorganisant et retardant les processus, détruisant des données, exposant les systèmes à des attaques opportunistes, fragilisant la confiance des clients et des investisseurs, voire se prolongeant jusque devant les tribunaux… Deux choses sont cependant certaines : le chiffre ne fait que croître et son ordre de grandeur est désormais considérable. En 2013, le Ponemon Institute évaluait le coût moyen d’un incident à près de 700 000 $ et, surtout, constatait une augmentation de 41 % en à peine trois ans. La même étude relevait par ailleurs que les défaillances matérielles étaient non seulement l’une des premières causes d’interruption de services mais aussi celles dont les conséquences étaient les plus coûteuses.
Bien sûr, pour se prémunir et assurer les très hauts niveaux de services exigés par les métiers (plus de 99,99 % pour près de trois quarts des entreprises), redondances, sauvegardes et plans de reprise et de continuité d’activité (PRA/PCA) sont impératifs. Mais ce ne sont là que des filets de sécurité, de coûteuses et inquiétantes roues de secours, et il est à la fois plus sûr et plus rentable de prendre le problème à la racine : maintenir l’infrastructure en parfait état de fonctionnement.
Or, ce qui peut apparaître comme une évidence pour des secteurs comme l’industrie ou les transports ne l’est pas forcément pour l’informatique. La difficulté de la maintenance IT est qu’elle s’applique en effet à des systèmes très complexes, interdépendants et hétérogènes qui ne fonctionnement jamais dans des conditions idéales. La plupart des pannes proviennent d’ailleurs du fait que les systèmes ne sont pas utilisés pour les tâches et/ou la charge pour lesquelles ils étaient prévus à l’origine. On ne peut donc guère se fier aux recommandations des constructeurs pour remplacer préventivement tel ou tel matériel ou composant, ce qui ne fait que renforcer une culture profondément ancrée du « tant que ça marche, on n’y touche pas » et de la débrouille héroïque face aux incidents.
Percer les mystères de la boîte noire
Mais tout cela, c’était avant. Avant que la technologie n’apporte elle-même la solution pour surmonter cet écueil de l’inintelligibilité des systèmes. Grâce aux progrès considérables du Big Data et de l’intelligence artificielle, il est désormais possible de percer les mystères de ces boîtes noires que sont les infrastructures IT et d’en prédire les défaillances suffisamment à l’avance pour les éviter. Pour cela, la clé, ce sont les données : un abondant historique du fonctionnement et des pannes de toutes sortes de matériels, des relevés en temps réels des conditions d’environnement, et un suivi précis des usages, de la nature et de l’intensité des sollicitations.
Une fois le système en place, on surveille et on décrypte en permanence les paramètres de fonctionnement des systèmes. Dès qu’une baisse de performance, un bruit ou une surchauffe anormaux sont détectés, on sait les identifier comme d’éventuels symptômes précoces de panne, en découvrir l’origine, mesurer dès lors le risque encouru par les métiers, et ainsi programmer sereinement et en toute connaissance de cause les nécessaires interventions. De cette façon, les actions de maintenance voient leurs impacts et leurs coûts réduits, et leur pertinence et leur qualité renforcées.
Grâce à la maintenance prédictive, l’IT peut garantir des niveaux de service élevés, qui soient économiquement et opérationnellement soutenables, pour des infrastructures de plus en plus complexes (IoT, systèmes embarqués…). Et les fondations matérielles, à la fois sûres et invisibles, deviennent un socle de confiance sur lequel bâtir l’innovation digitale.
Pour aller plus loin, découvrez tout ce que la maintenance prédictive peut apporter dans le secteur IT.