Etablissement : Université Paris-Saclay GS Ingormatique et sciences du numérique
Ăcole doctorale : Sciences et Technologies de lânformation et de la Communication
Spécialité : Informatique mathématique
UnitĂ© de recherche : Mdls â Maison de la Simulation
Encadrement de la thĂšse : Nahid EMAD PETITON
Co-Directeur : Thomas DUFAUD
Description de la problĂ©matique de recherche â Project description
La performance des simulateurs a un impact direct Ă la fois sur la qualitĂ© des rĂ©sultats de simulation, avec la prĂ©cision souhaitĂ©e et sur la capacitĂ© dâexplorer une grande variĂ©tĂ© dâhypothĂšses scientifiques. Dans un grand nombre de simulateurs numĂ©riques, la rĂ©solution de systĂšmes linĂ©aires, trĂšs souvent mal conditionnĂ©s, constitue lâĂ©tape la plus consommatrice en temps de calcul (jusquâĂ 80% de la simulation).
Les mĂ©thodes multigrilles font partie des solveurs et des prĂ©conditionneurs efficaces et puissants pour la rĂ©solution de grands systĂšmes linĂ©aires mal conditionnĂ©s. Cependant, le paramĂ©trage optimal de ces mĂ©thodes ; tels que lâalgorithme de lissage, les schĂ©mas de correction, le choix des opĂ©rateurs de restriction dĂ©pend du problĂšme Ă traiter et oriente fortement lâefficacitĂ© numĂ©rique de cette famille de mĂ©thodes. De plus, il existe plusieurs algorithmes multigrilles, comprenant diffĂ©rents algorithmes de lissage tels que Jacobi et Gauss- Seidel, diffĂ©rents schĂ©mas de correction tels que V-Cycle, W-Cycle et diffĂ©rents opĂ©rateurs de prolongation/restriction. Le choix des diffĂ©rents algorithmes et le rĂ©glage fin de ces paramĂštres amĂ©liore le taux de convergence de cette famille de mĂ©thode et influence le temps de calcul sur lâarchitecture cible type CPU, GPU ou TPU. Lâexpertise de lâutilisateur dans la sĂ©lection des paramĂštres est critique pour une utilisation optimale de ces mĂ©thodes.
En partant de ce constat, lâobjectif du travail de recherche proposĂ© est de concevoir et dâutiliser des techniques dâapprentissage afin de trouver pour la mĂ©thode multigrille algĂ©brique de meilleurs paramĂ©trages Ă la fois pour les problĂšmes linĂ©aires et non linĂ©aires Ă 2-3 dimensions. Les Ă©tudes ciblĂ©es seront issues de deux grandes catĂ©gories de simulations : la dynamique des fluides et lâĂ©coulement en milieu poreux. Parmi les applications sĂ©lectionnĂ©es, nous pouvons Ă©voquer les modĂ©lisations Fluide-particules, GĂ©omĂ©canique, et sĂ©questration du Co2, avec pour chacune des systĂšmes diffĂ©rents Ă rĂ©soudre.
Simulator performance has a direct impact both on the quality of simulation results, with the desired accuracy, and on the ability to explore a wide variety of scientific hypotheses. In a large number of numerical simulators, the resolution of linear systems, which are very often poorly conditioned, is the most time-consuming stage of the process (up to 80% of the simulation).
Multigrid methods are among the most efficient and powerful solvers and preconditioners for solving large, ill-conditioned linear systems. However, the optimal parameterization of these methods, such as the smoothing algorithm, the correction schemes and the choice of restriction operators, depends on the problem to be solved and strongly influences the numerical efficiency of this family of methods. In addition, there are several multigrid algorithms, including different smoothing algorithms such as Jacobi and Gauss-Seidel, different correction schemes such as V-Cycle, W-Cycle and different extension/restriction operators. The choice of different algorithms and the fine-tuning of these parameters improves the convergence rate of this family of methods and influences the computation time on the target CPU, GPU or TPU architecture. User expertise in parameter selection is critical for optimal use of these methods.
With this in mind, the aim of the proposed research work is to design and use learning techniques to find better parameterizations for the algebraic multigrid method, for both linear and non-linear 2-3-dimensional problems. The targeted studies will be drawn from two broad categories of simulations: fluid dynamics and porous media flow. Selected applications include fluid-particle modeling, geomechanics and Co2 sequestration, each with different systems to solve.
Context
La simulation numĂ©rique est un outil complĂ©mentaire aux Ă©tudes expĂ©rimentales permettant de comprendre finement les phĂ©nomĂšnes physiques complexes. Câest aussi une aide importante pour la mise au point et lâĂ©valuation de solutions techniques innovantes et prospectives. Elle est ainsi au cĆur de nombreux domaines tels que la mĂ©canique des fluides, la conception de matĂ©riaux ou les gĂ©osciences.
Dans un grand nombre de simulateurs numĂ©riques, la rĂ©solution de systĂšmes linĂ©aires, trĂšs souvent mal conditionnĂ©s, constitue lâĂ©tape la plus consommatrice en temps de calcul (jusquâĂ 80% de la simulation). Les prĂ©conditionneurs employĂ©s voient leurs performances variĂ©es en fonction des paramĂštres choisis. Lâexpertise de lâutilisateur dans la sĂ©lection des paramĂštres est ainsi nĂ©cessaire pour une utilisation optimale de ces mĂ©thodes.
Dans ce projet, nous nous intĂ©ressons aux systĂšmes linĂ©aires issus de la discrĂ©tisation dâun problĂšme de poisson Ă coefficients variables. Ce problĂšme est au cĆur de nombreuses mĂ©thodes numĂ©riques pour la simulation dâĂ©coulements de type Darcy ou Navier-Stockes. Les mĂ©thodes multigrilles algĂ©briques (AMG) sont parmi les plus efficaces pour rĂ©soudre les systĂšmes linĂ©aires associĂ©s Ă la discrĂ©tisation de cette Ă©quation sur des maillages non structurĂ©s. Ces mĂ©thodes emploient des opĂ©rateurs de âsmoothingâ pour rĂ©duire les composantes Ă haute frĂ©quence de lâerreur, des opĂ©rateurs de restriction pour projeter le problĂšme sur des grilles grossiĂšres et enfin des opĂ©rateurs de prolongation pour revenir sur les tailles de grilles fines initiales. Chacune de ces Ă©tapes, ainsi que leur ordonnancement en cycles, dispose de nombreux paramĂštres Ă sĂ©lectionner (type de smoother et nombre dâitĂ©rations, choix des opĂ©rateurs de restriction et prolongation pour tenir compte de la variabilitĂ© des coefficients de lâĂ©quation, ou encore agencement des cycles multigrilles) (Briggs et al.). Le paramĂ©trage optimal de ces mĂ©thodes dĂ©pend fortement du problĂšme physique modĂ©lisĂ© et reprĂ©sente une difficultĂ© importante dans leur adoption.
Il est ainsi nĂ©cessaire de dĂ©velopper des mĂ©thodes dâapprentissage permettant dâaccĂ©lĂ©rer la convergence des mĂ©thodes multigrilles, soit en obtenant un paramĂ©trage optimal de mĂ©thodes existantes, soit en imitant directement les mĂ©thodes existantes. De nombreux travaux rĂ©cents se sont engagĂ©s dans ces deux voies :
â OpĂ©rateurs de projection : (Katrutsa et al.) et (Greenfeld et al.) proposent des mĂ©thodes dâapprentissage non supervisĂ©es pour optimiser le paramĂ©trage des opĂ©rateurs de prolongation et restriction des mĂ©thodes multigrilles gĂ©omĂ©triques (GMG) Ă deux niveaux avec une fonction coĂ»t permettant de minimiser le rayon spectral de la matrice dâitĂ©ration. (Luz et al.) Ă©tendent ces travaux Ă des mĂ©thodes AMG en utilisant des Graph Neural Networks (GNN) pour gĂ©rer les maillages non structurĂ©s.
â Smoother : (Hsieh et al.) proposent une mĂ©thode dâapprentissage supervisĂ©e basĂ©e sur des Convolutional Neural Networks (CNN) et lâarchitecture U-Net afin dâapprendre une correction Ă lâalgorithme de Jacobi tout en conservant les garanties de convergence. (Huang et al.) Ă©tendent ces travaux Ă lâoptimisation du smoother de Jacobi dans les mĂ©thodes GMG.
Ces travaux sâappuient notamment sur le parallĂšle dĂ©veloppĂ© par (He et al.) entre les mĂ©thodes multi-grilles et les rĂ©seaux de convolution. En effet, le passage dâune grille grossiĂšre Ă une grille fine (et inversement) peut ĂȘtre vu comme une Ă©tape de filtrage dâun CNN.
Les rĂ©sultats observĂ©s montrent une accĂ©lĂ©ration dâun facteur 2 Ă 10 de la convergence des algorithmes existants tout en conservant dâexcellentes propriĂ©tĂ©s de gĂ©nĂ©ralisation. Cependant, ces travaux sont limitĂ©s Ă des Ă©tapes spĂ©cifiques des mĂ©thodes multigrilles et ont pour cible principale les mĂ©thodes GMG, restreignant leur utilisation aux maillages structurĂ©s sur des problĂšmes simplifiĂ©s.
Lâobjectif principal de ce travail de thĂšse est de dĂ©velopper des mĂ©thodes dâapprentissage pour la rĂ©solution des systĂšmes linĂ©aires prĂ©conditionnĂ©s issus de la discrĂ©tisation sur maillages non structurĂ©s du problĂšme de Poisson Ă coefficients variables. Ces mĂ©thodes doivent permettre dâaccĂ©lĂ©rer la convergence des algorithmes multigrilles sur des architectures matĂ©rielles hĂ©tĂ©rogĂšnes.
La simulation numĂ©rique est un outil complĂ©mentaire aux Ă©tudes expĂ©rimentales permettant de comprendre finement les phĂ©nomĂšnes physiques complexes. Câest aussi une aide importante pour la mise au point et lâĂ©valuation de solutions techniques innovantes et prospectives. Elle est ainsi au cĆur de nombreux domaines tels que la mĂ©canique des fluides, la conception de matĂ©riaux ou les gĂ©osciences.
Dans un grand nombre de simulateurs numĂ©riques, la rĂ©solution de systĂšmes linĂ©aires, trĂšs souvent mal conditionnĂ©s, constitue lâĂ©tape la plus consommatrice en temps de calcul (jusquâĂ 80% de la simulation). Les prĂ©conditionneurs employĂ©s voient leurs performances variĂ©es en fonction des paramĂštres choisis. Lâexpertise de lâutilisateur dans la sĂ©lection des paramĂštres est ainsi nĂ©cessaire pour une utilisation optimale de ces mĂ©thodes.
Dans ce projet, nous nous intĂ©ressons aux systĂšmes linĂ©aires issus de la discrĂ©tisation dâun problĂšme de poisson Ă coefficients variables. Ce problĂšme est au cĆur de nombreuses mĂ©thodes numĂ©riques pour la simulation dâĂ©coulements de type Darcy ou Navier-Stockes. Les mĂ©thodes multigrilles algĂ©briques (AMG) sont parmi les plus efficaces pour rĂ©soudre les systĂšmes linĂ©aires associĂ©s Ă la discrĂ©tisation de cette Ă©quation sur des maillages non structurĂ©s. Ces mĂ©thodes emploient des opĂ©rateurs de âsmoothingâ pour rĂ©duire les composantes Ă haute frĂ©quence de lâerreur, des opĂ©rateurs de restriction pour projeter le problĂšme sur des grilles grossiĂšres et enfin des opĂ©rateurs de prolongation pour revenir sur les tailles de grilles fines initiales. Chacune de ces Ă©tapes, ainsi que leur ordonnancement en cycles, dispose de nombreux paramĂštres Ă sĂ©lectionner (type de smoother et nombre dâitĂ©rations, choix des opĂ©rateurs de restriction et prolongation pour tenir compte de la variabilitĂ© des coefficients de lâĂ©quation, ou encore agencement des cycles multigrilles) (Briggs et al.). Le paramĂ©trage optimal de ces mĂ©thodes dĂ©pend fortement du problĂšme physique modĂ©lisĂ© et reprĂ©sente une difficultĂ© importante dans leur adoption.
Il est ainsi nĂ©cessaire de dĂ©velopper des mĂ©thodes dâapprentissage permettant dâaccĂ©lĂ©rer la convergence des mĂ©thodes multigrilles, soit en obtenant un paramĂ©trage optimal de mĂ©thodes existantes, soit en imitant directement les mĂ©thodes existantes. De nombreux travaux rĂ©cents se sont engagĂ©s dans ces deux voies :
â OpĂ©rateurs de projection : (Katrutsa et al.) et (Greenfeld et al.) proposent des mĂ©thodes dâapprentissage non supervisĂ©es pour optimiser le paramĂ©trage des opĂ©rateurs de prolongation et restriction des mĂ©thodes multigrilles gĂ©omĂ©triques (GMG) Ă deux niveaux avec une fonction coĂ»t permettant de minimiser le rayon spectral de la matrice dâitĂ©ration. (Luz et al.) Ă©tendent ces travaux Ă des mĂ©thodes AMG en utilisant des Graph Neural Networks (GNN) pour gĂ©rer les maillages non structurĂ©s.
â Smoother : (Hsieh et al.) proposent une mĂ©thode dâapprentissage supervisĂ©e basĂ©e sur des Convolutional Neural Networks (CNN) et lâarchitecture U-Net afin dâapprendre une correction Ă lâalgorithme de Jacobi tout en conservant les garanties de convergence. (Huang et al.) Ă©tendent ces travaux Ă lâoptimisation du smoother de Jacobi dans les mĂ©thodes GMG.
Ces travaux sâappuient notamment sur le parallĂšle dĂ©veloppĂ© par (He et al.) entre les mĂ©thodes multi-grilles et les rĂ©seaux de convolution. En effet, le passage dâune grille grossiĂšre Ă une grille fine (et inversement) peut ĂȘtre vu comme une Ă©tape de filtrage dâun CNN.
Les rĂ©sultats observĂ©s montrent une accĂ©lĂ©ration dâun facteur 2 Ă 10 de la convergence des algorithmes existants tout en conservant dâexcellentes propriĂ©tĂ©s de gĂ©nĂ©ralisation. Cependant, ces travaux sont limitĂ©s Ă des Ă©tapes spĂ©cifiques des mĂ©thodes multigrilles et ont pour cible principale les mĂ©thodes GMG, restreignant leur utilisation aux maillages structurĂ©s sur des problĂšmes simplifiĂ©s.
Lâobjectif principal de ce travail de thĂšse est de dĂ©velopper des mĂ©thodes dâapprentissage pour la rĂ©solution des systĂšmes linĂ©aires prĂ©conditionnĂ©s issus de la discrĂ©tisation sur maillages non structurĂ©s du problĂšme de Poisson Ă coefficients variables. Ces mĂ©thodes doivent permettre dâaccĂ©lĂ©rer la convergence des algorithmes multigrilles sur des architectures matĂ©rielles hĂ©tĂ©rogĂšnes.
Références :
(Briggs et al.) William Briggs, Van Henson and Steve McCormick. A Multigrid Tutorial, 2nd Edition, SIAM, (2000) ISBN: 9780898714623. (Huang et al.) Ru Huang, Ruipeng Li and Yuanzhe Xi. Learning optimal multigrid smoothers via neural networks, (2021) arXiv:2102.1207v1 (Katrutsa et al.) Alexandr Katrutsa, Talgat Daulbaev and Ivan Oseledets. Deep Multigrid: learning prolongation and restriction matrices, (2017) arXiv:1711.03825v1.
(He et al.) Juncai He and Jinchao Xu. MgNet: A unified framework of multigrid and convolutional neural network. Sci. China Math. (2019). https://doi.org/10.1007/s11425-019-9547-2
(Hsieh et al.) Jun-Ting Hsieh, Shengjia Zhao, Stephan Eismann, Lucia Mirabella and Stefano Ermon. Learning Neural PDE Solvers with Convergence Guarantees (2019). arXiv:1906.01200v1
(Greenfeld et al.) Daniel Greenfeld, Meirav Galun, Ron Kimmel, Irad Yavneh and Ronen Basri. Learning to Optimize Multigrid PDE Solvers. ICML (2019). arXiv:1902.10248
(Luz et al.) Ilay Luz, Meirav Galun, Haggai Maron, Ronen Basri and Irad Yavneh. Learning Algebraic Multigrid Using Graph Neural Networks (2020). arXiv:2003.05744
Objectifs
Lâobjectif principal de ce travail de thĂšse est de dĂ©velopper des mĂ©thodes dâapprentissage pour la rĂ©solution des systĂšmes linĂ©aires prĂ©conditionnĂ©s issus de la discrĂ©tisation sur maillages non structurĂ©s du problĂšme de Poisson Ă coefficients variables. Ces mĂ©thodes doivent permettre dâaccĂ©lĂ©rer la convergence des algorithmes multigrille sur des architectures matĂ©rielles hĂ©tĂ©rogĂšnes.
Méthode
Afin de rĂ©pondre Ă lâobjectif fixĂ©, nous proposons un plan de travail en 4 Ă©tapes :
â Etat de lâart des mĂ©thodes multigrilles amĂ©liorĂ©e par lâIA : Il sâagit dans un premier temps de faire un inventaire des mĂ©thodes dâaccĂ©lĂ©ration de chaque Ă©tape des algorithmes multigrilles. Il faudra Ă©valuer leur impact en analysant les taux de convergence et le rayon spectral des opĂ©rateurs de transfert dâerreur rĂ©sultants. Les travaux porteront dâabord sur des maillages structurĂ©s (rĂ©seau CNN) puis sur des maillages non structurĂ©s (rĂ©seau GNN)
â Conception dâun solveur linĂ©aire multigrille hybride par composant : Sur la base des travaux prĂ©cĂ©dents, il sâagira ensuite de proposer un choix de mĂ©thode dâapprentissage pour accĂ©lĂ©rer chaque Ă©tape du solveur multigrille (smoother, opĂ©rateurs de projection, niveaux de grille et type de cycle). Ces mĂ©thodes seront entraĂźnĂ©es de maniĂšre indĂ©pendante puis assemblĂ©es lors de lâĂ©valuation du modĂšle.
â Conception dâun solveur linĂ©aire multigrille global : Lâoptimisation de chaque paramĂštre nâest pas complĂštement indĂ©pendante des autres composantes: une fois lâapproche par bloc Ă©tablie, on cherchera Ă enchaĂźner directement les Ă©tapes du solveur multigrille hybride dans un entraĂźnement global.
â DĂ©veloppement dâun framework gĂ©nĂ©ral de solveur linĂ©aire hybride : Les mĂ©thodes de prĂ©conditionnement construites Ă partir des mĂ©thodes de dĂ©flation, de dĂ©composition de domaine ou multigrille ont des Ă©quivalences (Tang et al., DOI:10.1007/s10915-009-9272-6). Lâobjectif sera dâadapter les mĂ©thodologies dĂ©veloppĂ©es prĂ©cĂ©demment pour accĂ©lĂ©rer ces divers types de mĂ©thodes.
LâefficacitĂ© des mĂ©thodes dĂ©veloppĂ©es sera Ă©valuĂ©e sur des applications industrielles telles que les modĂ©lisations des interactions Fluide-particules, la GĂ©omĂ©canique, ou la sĂ©questration du Co2, avec chacune des systĂšmes linĂ©aires Ă rĂ©soudre ayant des caractĂ©ristiques diffĂ©rentes.
Nous évaluons la généralisation de ces méthodes sur un ensemble de paramÚtres de simulation variables : problÚme physique sous- jacent, géométrie du domaine, conditions aux bord ou encore taille initiale de la grille.
RĂ©sultats attendus â Expected results
La premiĂšre cible de la thĂšse est lâĂ©laboration et la validation de la solution proposĂ©e. Ces composants logiciels seront dans un premier temps intĂ©grĂ©s dans une bibliothĂšque Ă©crite dans des frameworks spĂ©cifiques (Tensorflow, Pytorch, JAX) permettant de bĂ©nĂ©ficier directement dâune performance optimisĂ©e sur les architectures matĂ©rielles de type CPU, GPU voire TPU.
Cette solution pourra Ă©galement ĂȘtre interfacĂ©e dans les bibliothĂšques telles que Trilinos et AMGX ce qui nous permettra dâavoir des solutions performantes de rĂ©fĂ©rence Ă la fois sur CPU et GPU. Son efficacitĂ© et sa portabilitĂ© seront ensuite Ă©valuĂ©es dans les simulations de la dynamique des fluides et lâĂ©coulement en milieu poreux.