Stage

Stage ingénieur-M2: Développement d’outils de surveillance d’une application de calcul intensif en temps réelpour le Cherenkov Telescope Array Observatory (CTAO)

CTAO utilisera 2 réseaux de plusieurs dizaines de télescopes pour observer l’univers dans
une gamme de très hautes énergies. Les données collectées seront analysées en temps
réel afin de réagir à ou d’émettre des alertes scientifiques. Le logiciel effectuant cette
analyse est développé pour partie au Laboratoire d’Annecy de Physique des Particules : il
doit combiner en temps réel plusieurs gigaoctets de données provenant de nombreux
télescopes pour reconstruire les caractéristiques des rayons gamma.

L’objectif du stage est d’implémenter un outil de surveillance du logiciel d’analyse,
permettant de monitorer les différents processus d’analyse et les flux de données. L’outil
devra agréger des métriques de performance des nœuds de calculs (utilisation cpu,
mémoire, réseau), des métriques des processus d’analyse (quantité et latence des
échanges de données, temps de calculs) et permettre leur visualisation.

Missions :

• Réaliser une veille technologique sur les différents outils et frameworks de collecte
de métriques (prometheus, CheckMK) et de design d’interface (Grafana, ncurses,
VueJS, Streamlit).
• Collecter et agréger des métriques de performance liées au calcul et aux réseaux
(C++, Python, ZeroMQ, gestion de sockets).
• Concevoir et implémenter un ou plusieurs Proof of Concept (POC) afin d’évaluer
les solutions identifiées.
Compétences développées :
• Développement en C++ et Python
• Déploiement sur des fermes de calculs avec slurm, htcondor, kubernetes et
collecte de métriques (prometheus, CheckMK)
• Mise en œuvre de communications asynchrones via gestionnaires de sockets et
backend ZeroMQ.
• Conception et design d’interfaces de visualisation (VueJS, Grafana, ncurses).
• Collaboration au sein d’une équipe pluridisciplinaire et internationale, offrant
une expérience enrichissante en environnement de développement collaboratif.

Informations:

Domaine: informatique

Expérience: CTA

Durée: 6 mois

Début du stage: janvier 2026

Responsable de stage: Vincent POLLET

Email: vincent.pollet@lapp.in2p3.fr