Dans la première partie de l’article, nous avons vu comment la supervision pouvait apporter de la valeur à court terme au SI. Dans cette seconde partie, nous verrons comment la supervision peut permettre d’établir des services répondant à des besoins à plus long terme.
Pour cela on va utiliser la supervision pour capitaliser et modéliser.
Capitaliser sur les incidents rencontrés n’amène pas forcément jusqu’à la proactivité mais :
La supervision permet de remonter un événement (un incident, une alerte) qu’il est possible de rapprocher d’un événement déjà survenu et renseigné dans une base de connaissance et dont je peux établir directement la cause pour proposer une solution. Le but est donc de capitaliser sur l'analyse post-mortem pour améliorer continuellement le système : On a trouvé la cause du mal et on sait guérir, on sait détecter les symptômes pour agir avant propagation du mal, on a trouvé le vaccin contre le mal. A ce jeu, le Lean et les 5 pourquoi sont certainement vos meilleurs alliés et des outils indispensables pour réaliser des post-mortem efficaces.
Modéliser, c’est essayer de rendre son système prédictif en construisant des abaques d’utilisation des ressources matérielles par la solution applicative. On y corrèle les temps de réponses, l’utilisation des ressources et l’activité métier au cours du temps sur la production. Là où la campagne de tests de charge permet d’identifier les évolutions matérielles nécessaires au passage d’un palier en termes de volumétrie (charge utilisateurs d’une nouvelle organisation déployée, volume de données reprises), la modélisation, en reposant sur la supervision continue du système, va permettre d’identifier les évolutions matérielles en fonction de l’accroissement naturel de la volumétrie dans le système (nouveaux utilisateurs, volume de données créés par les interfaces) et de mesurer les impacts réels en production de nouvelles fonctionnalités dans la solution.
On définit ainsi le plan de capacité de la solution qui va permettre à un directeur informatique de mieux prévenir les besoins matériels et de concevoir son budget en conséquence en apportant les éléments de justifications à sa direction.
Ce dispositif permet également de détecter les problèmes de performance dans la solution (fuites mémoires, consommation excessive de la CPU, temps de réponses qui se dégradent…).
Le deuxième enjeu a attrait à la performance métier du SI. On l’associe souvent à la supervision de type BAM (Business Activity Monitoring) ou BPM (Business Process Monitoring). Ce sont pour moi des outils qui adressent plus une problématique métier (gestion des stocks au quotidien, détection en temps réel d’une activité anormale sur mon callcenter,…) qu’une problématique DSI (en l’occurrence montrer que l’IT répond aux exigences de performance métier).
Plutôt que de mettre de tels outils en place, il est peut-être préférable de l’intégrer dans la solution existante en écrivant les informations utiles dans les logs applicatives par exemple. Quelles sont ces informations utiles ? Des indicateurs de la performance métier du SI. Il s’agit en définitive de mesurer des métriques sur certaines activités métier clés du SI. Assez simple à réaliser dans le contexte d’un traitement batch où l’on veut savoir le nombre de produits mis à jour par exemple, plus complexe lorsque l’on veut connaître le temps moyen de souscription à un produit, transaction qui parcours notre SI du Front office jusqu’au Back office et peut traverser un serveur web, un ESB ou un EAI, un Application Server, une base de données, des firewalls…Rien d’insurmontable non plus, je vous rassure.
Ce type d'indicateurs est plus représentatif de la performance de la solution que « le temps d’accès à une page web est inférieure à 3 secondes». Il est aussi plus « parlant » quand il s’agit de s’adresser par des chiffres et des indicateurs à une direction métier.
Pour conclure, la mise en place de la supervision du SI doit apporter à une DSI un levier pour :
Elle repose sur la mise en œuvre :