Génération hybride de la réponse sismique de site par simulation et apprentissage machine
L’estimation précise de la réponse sismique suite à un tremblement de terre permet de sauver des vies. Toutefois, la limitation des ressources informatiques et la variabilité méconnue et mal caractérisée de la géologie et du contexte sismotectonique posent des défis significatifs pour les simulations à l’échelle d’une ville ou d’une région. Cette thèse propose une nouvelle approche combinant les méthodes d’apprentissage adverse (adversarial) et les simulations basées sur la physique pour surmonter ces limitations, en s’appuyant sur le cadre SeismoALICE, ( F. GATTI et D. CLOUTEAU: "Towards blending Physics-Based numerical simulations and seismic databases using Generative Adversarial Network", CMAME 2020).
En raison des fluctuations aléatoires des propriétés mécaniques du milieu géologiqu, les simulations numériques ne peuvent donner des résultats que pour les basses fréquences (BF) jusqu’à 5 voire 10 Hz. La fréquence de conception des structures et des équipements en génie civil atteint en revanche 40 Hz. Cette thèse vise à simuler des signaux sismiques plus riches en fréquences [0 – 30 Hz] à partir de la connaissance des signaux à basses fréquences et d’une base de données de signaux enregistrés.
Dans ce but, nous développons un encodeur et un décodeur adaptés aux signaux sismiques utilisant une variante des techniques d’attention, nommée Conformer, pour capturer les corrélations de longue durée présentes dans les accélérogrammes. Le discriminateur, assurant que les signaux simulés ressemblent à des signaux enregistrés, a fait l’objet d’un développement poussé, permettant d’optimiser l’encodeur et le décodeur par le biais d’une technique de min-max au cœur des méthodes adverses d’apprentissage machine. Pour forcer a reconstruction des signaux, nous adaptons aux séries temporelles la Focal Frequency Loss (FFL) et la Hyper-Spherical Loss (HSL), qui sont plus performantes pour ce type de données. Ensuite, nous complétons les signaux BF jusqu’à 30 Hz en explorant différents cas de génération : mapping one-to-one et mapping one-to-many pour évaluer la plausibilité des reconstructions de la base de données. Cinq méthodes ont été élaborées : Signal-to-Signal Translation, SeismoALICE with shared latent space, SeismoALICE with factorized latent space, BicycleGAN for time series et Multi-Modal Signal Translation. Leur performance a été évaluée avec le Goodness-of-Fit de Kristeková.
Nous avons prouvé en manipulant les variables cachées qu’il est possible de diviser l'information en deux groupes de variables de distributions Gaussiennes, l’un pour les basses fréquences et l’autre pour les hautes fréquences. Cette interprétabilité a permis de manipuler l’espace latent et de contrôler le mapping one-to-many. Les modèles, entraînés sur 128 000 signaux sismiques de la base de données des séismes de Stanford (STEAD), démontrent leur performance avec des qualités de prédiction allant de bonnes à excellentes. Finalement, leur efficacité a été démontrée par une application au séisme du Teil de 2019 (en Ardèche dans la région Auvergne-Rhone-Alpes, France). Ce travail ouvre la voie à une prédiction plus précise et plus efficace des signaux sismiques en intégrant de manière transparente les connaissances basées sur la physique et l'apprentissage machine.
Le jury sera composé des membres suivants :
- M. Fernando LOPEZ CABALLERO CentraleSupélec Examinateur
- M. Jean-Francois SEMBLAT ENSTA Paris Examinateur
- Mme Wassila OUERDANE CentraleSupélec Examinatrice
- M. Maarten ARNST Université Libre de Liège Rapporteur
- M. Dimitris PITILAKIS Aristotle University of Thessaloniki, Grèce Rapporteur