Supervision d'un cluster Kubernetes

Tout doit être vu dans Grafana :

  • consommation disque d’un noeud physique K8S

—> alerte si 80% utilsé

  • suivi de consommation du bucket S3 PaxPar

  • journal d’un pod spécifique

—> affichage des print d’un service fastapi

  • suivi du nombre d’appels de l’API /……

  • suivi du temps de réponse de l’appel (3 pistes - controller / code python / sidebar / jaeger / istio )

  • suivi du nombre de pages PDFs traité par PaxPar

A tester : résilience au rédémarrage d’un noeud / réinstallation d’un cluster

supervision_k8s