Maîtriser l'Observabilité avec Prometheus et Grafana : Du Monitoring à la Performance SRE Mixte : présentiel / à distance

Dernière mise à jour : 19/03/2026

Description

Module 1 : Fondements du Monitoring Moderne et Architecture

  • L'évolution du monitoring : De la surveillance d'état (UP/DOWN) à l'Observabilité.
  • Architecture de Prometheus : Modèle "Pull" vs "Push", stockage TSDB, Service Discovery.
  • Modèle de données : Séries temporelles, Labels et types de métriques (Counter, Gauge, Histogram, Summary).
  • Installation : Méthodes de déploiement (Binaire, Docker, Helm).
  • Atelier Pratique : Installation d'un serveur Prometheus via Docker-Compose. Configuration du premier "Scrape" sur soi-même et exploration de l'interface d'expression.

 

Module 2 : Collecte de données et Instrumentation

  • L'écosystème des Exporters : Focus sur Node Exporter (Système), Blackbox Exporter (Sondage réseau) et Process Exporter.
  • Instrumentation applicative : Comment exposer des métriques personnalisées dans son code (Python/Go/Java).
  • Le rôle de la Pushgateway : Gérer les jobs éphémères (Batchs/Cron).
  • Service Discovery : Automatisation de la découverte des cibles.
  • Atelier Pratique : Mise en place d'un Node Exporter pour surveiller un hôte Linux. Instrumentation d'une application web simple pour suivre le nombre de requêtes et la latence.

 

Module 3 : Le langage PromQL (Niveau Intermédiaire à Avancé)

  • Syntaxe de base : Sélecteurs, filtres et vecteurs instantanés vs vecteurs de plage.
  • Opérateurs et Fonctions : rate(), irate(), increase(), sum(), by().
  • Calcul des Percentiles : Utilisation des histogrammes pour calculer le P95/P99.
  • Indicateurs SRE : Traduire des SLI (Service Level Indicators) en requêtes PromQL.
  • Atelier Pratique : Série d'exercices "Defi PromQL" : calculer le taux de succès d'une API, détecter une fuite mémoire, et mesurer la latence moyenne sur les 5 dernières minutes.

 

Module 4 : Visualisation Avancée avec Grafana

  • Configuration : Connexion aux sources de données et gestion des organisations/utilisateurs.
  • Création de Panneaux : Graphs, Stat, Gauge, Bar Gauge, Table, et le nouveau panel Canvas.
  • Dynamisme : Variables de templates et répétition de lignes (Rows) pour le multi-environnement.
  • Dashboard-as-Code : Introduction à l'import/export JSON et au provisionnement automatique.
  • Atelier Pratique : Création d'un "Dashboard de Production" unifié regroupant métriques système et métriques applicatives, avec filtres par serveur.

 

Module 5 : Alerting Intelligent et Alertmanager

  • Règles d'alerte : Syntaxe des Alerting Rules dans Prometheus.
  • Architecture Alertmanager : Groupement, Inhibition et Silencing (mise sous silence).
  • Routage des alertes : Configuration des récepteurs (Slack, Email, Webhooks).
  • Recording Rules : Optimiser les performances de Prometheus en pré-calculant les requêtes lourdes.
  • Atelier Pratique : Configuration d'une alerte sur un seuil critique de disque et une alerte de "taux d'erreur anormal". Mise en place d'un routage vers un canal de communication instantanée.

 

Module 6 : Maintenance, Sécurité et Scalabilité

  • Sécurisation : Authentification, TLS et permissions.
  • Stockage et Rétention : Gestion de l'espace disque et introduction aux solutions Long-Term Storage (Thanos/Cortex/Mimir).
  • Troubleshooting : Diagnostiquer les problèmes de performance de Prometheus.
  • TP Final : Projet "Full-Stack Observability"
    • Déploiement d'une application multi-services sur un cluster k3d (Kubernetes léger).
    • Mise en place de la supervision via l'opérateur Prometheus.
    • Création d'un dashboard Grafana corrélant les ressources Kubernetes et la santé de l'application.
    • Test de montée en charge et vérification du déclenchement des alertes.

Objectifs de la formation

À l'issue de la formation, le stagiaire sera capable de :

  • Déployer et configurer une stack complète Prometheus / Grafana dans des environnements variés (Docker/Kubernetes).

  • Collecter et structurer des métriques via les exporteurs officiels et l'instrumentation applicative.

  • Extraire des indicateurs précis (SLI/SLO) en maîtrisant le langage de requête PromQL.

  • Concevoir des dashboards professionnels et dynamiques avec Grafana en suivant les meilleures pratiques de visualisation.

  • Mettre en place une stratégie d'alerting intelligente et proactive avec Alertmanager.

Public visé

  • Ingénieurs DevOps et SRE (Site Reliability Engineers).

  • Administrateurs Systèmes et Réseaux.

  • Développeurs Back-end souhaitant instrumenter leurs applications.

  • Architectes Infrastructure et Cloud.

Prérequis

  • Maîtrise de la ligne de commande Linux (Bash).

  • Notions fondamentales sur les conteneurs (Docker).

  • Compréhension de base des protocoles réseau (HTTP, TCP/IP).

Modalités pédagogiques

Session dispensée en présentiel ou téléprésentiel, selon la modalité inter-entreprises ou intra-entreprises sur mesure. 

La formation est animée par un(e) formateur(trice) durant toute la durée de la session et présentant une suite de modules théoriques clôturés par des ateliers pratiques validant l'acquisition des connaissances. Les ateliers peuvent être accompagnés de Quizz.

L'animateur(trice) présente la partie théorique à l'aide de support de présentation, d'animation réalisée sur un environnement de démonstration.

En présentiel comme en téléprésentiel, l'animateur(trice) accompagne les participants durant la réalisation des ateliers.

Moyens et supports pédagogiques

Cadre présentiel

Salles de formation équipées et accessibles aux personnes à mobilité réduite.

- Un poste de travail par participant

- Un support de cours numérique ou papier (au choix)

- Un bloc-notes + stylo

- Vidéoprojection sur tableau blanc

- Connexion Internet

- Accès extranet pour partage de documents et émargement électronique

Cadre téléprésentiel

Session dispensée via notre solution iClassroom s'appuyant sur Microsoft Teams.

- Un compte Office 365 par participant

- Un poste virtuel par participant

- Un support numérique (PDF ou Web)

- Accès extranet pour partage de documents et émargement électronique

Modalités d'évaluation et de suivi

Avant

Afin de valider le choix d'un programme de formation, une évaluation des prérequis est réalisée à l'aide d'un questionnaire en ligne ou lors d'un échange avec le formateur(trice) qui validera la base de connaissances nécessaires.

Pendant

Après chaque module théorique, un ou des ateliers pratiques permettent la validation de l'acquisition des connaissances. Un Quizz peut accompagner l'atelier pratique.

Après

Un examen de certification si le programme de formation le prévoit dans les conditions de l'éditeur ou du centre de test (TOSA, Pearson Vue, ENI, PeopleCert)

Enfin

Un questionnaire de satisfaction permet au participant d'évaluer la qualité de la prestation.

M'inscrire à la formation

Ajouter au panier

Session sélectionnée


  • Balma COMPLÈTE

Prochaines Sessions

  • Pour connaître les dates des prochaines sessions de formation inter-entreprises, veuillez nous contacter par téléphone au 05 61 34 39 80 ou par courriel à l'adresse contact@iform.fr

Partager cette formation

Accessibilité

Sélectionnez le niveau de contraste souhaité
Adaptez la taille de la police
Sélectionnez la police de caractères souhaitée

Déclaration d'accessibilité