Soutenance

Thomas Gasparetto – Soutenance de thèse – 7 mai 2020

Développement d'une ferme informatique utilisant le Cloud Computing sur GPU

Tous les travaux de cette thèse ont été développés dans le contexte du Cherenkov Telescope Array (CTA), qui sera le principal observatoire de la prochaine génération pour l’astronomie gamma à très haute énergie au sol. Le plan de ce travail est d’utiliser les GPU et le Cloud Computing afin d’accélérer les tâches de calcul exigeantes, en développant et en optimisant les pipelines d’analyse de données.La thèse se compose de deux parties: la première est destinée à l’estimation des performances du CTA pour l’observation de phénomènes violents tels que ceux générant des sursauts de rayons gamma (GRB) et des ondes gravitationnelles, avec un premier travail effectué pour la création des modèles pour le premier CTA Data Challenge (DC1). La deuxième partie de la thèse est liée au développement des pipelines pour la reconstruction des données de bas niveau provenant des simulations de Monte Carlo.

Dans le chapitre 1, je présente les détails du projet CTA, les télescopes et les performances du réseau, ainsi que les méthodes utilisées pour les dériver des simulations de Monte Carlo. Les objectifs scientifiques du CTA et les Key Science Projects (KSP) seront couverts dans le chapitre 2, avec un accent sur les GRB et le suivi des événements liés aux ondes gravitationnelles.Plus de 500 AGNs ont été modélisées pour le DC1, qui a été important à la fois pour impliquer davantage de personnes dans l’analyse des données du CTA et pour calculer le temps d’observation nécessaire aux différents KSP. Les simulations pour les papier du Consortium sur les ondes gravitationnelles et les sursauts gamma ont été créés avec le pipeline ctools_pipe (présenté au chapitre 4), mis en œuvre autour des bibliothèques ctools et gammalib. Le pipeline est composé de deux parties: la tâche à exécuter (simulation de fond, création de modèle et la partie qui effectue la détection) et dans quel centre de calcul.La deuxième partie de la thèse est axée sur le développement et l’optimisation des pipelines d’analyse à utiliser pour la reconstruction d’événements à partir de données brutes simulées et pour la visualisation des événements dans un espace 3D. Ces analyses ont été réalisées à l’aide de ctapipe, un framework pour le prototypage des algorithmes de traitement de données de bas niveau pour CTA. La structure de la bibliothèque est présentée dans le chapitre 5, avec un accent particulier sur les méthodes de reconstruction qui sont mises en œuvre dans ctapipe, y compris le système ImPACT. Cette méthode utilise un modèle d’images créé à partir des simulations de Monte Carlo et une « seed » de la méthode de reconstruction standard pour s’adapter entre les modèles afin de trouver une meilleure estimation des paramètres de la gerbe atmosphérique. Le profilage temporel et les stratégies adoptées pour optimiser le pipeline ImPACT sont présentés au chapitre 6. 

L’implémentation d’un pipeline pour l’analyse de l’observation du Large Size Telescope en mode monoscopique et son implémentation GPU avec PyTorch est également présentée. ctapipe a également été utilisé et développé pour estimer les performances du CTA lors d’observations en mode « pointage divergent », dans lequel les directions de pointage sont légèrement différentes par rapport au mode de pointage parallèle, de sorte que l’hyper champ de vision final de tous les télescopes est plus grand par rapport au mode de pointage parallèle. Les résolutions angulaires et énergétiques ainsi que la sensibilité sont moins bonnes dans ce scénario, mais le fait d’avoir un hyper field-of-view plus large peut être bénéfique pour d’autres sujets, comme la recherche de sources transitoires. Les modifications du code de reconstruction introduites dans ctapipe et certains tracés de résolution angulaire pour les gammas de source ponctuelle simulés sont présentés au chapitre 7.Les résultats présentés dans cette thèse sont une démonstration de l’utilisation de techniques logicielles avancées en astrophysique de très haute énergie.