Installé en région parisienne à l’Institut du développement et des ressources en informatique scientifique (Idris), centre de calcul intensif du CNRS, ce supercalculateur servira principalement à la simulation numérique ainsi qu’à ses applications à l’intelligence artificielle.
Il s’appelle Jean Zay, en hommage au ministre de l’éducation nationale du Front populaire et créateur du CNRS, et remplace Ada et Turing, deux autres supercalculateurs déjà présents sur le plateau de Saclay. La société civile Genci (Grand équipement national de calcul intensif) en avait annoncé l’acquisition, en janvier 2019, auprès de Hewlett Packard Enterprise (HPE), pour un montant de 25 millions d’euros. Doté d’une puissance de 14 pétaflop/s, soit 14 millions de milliards d’opérations par seconde (un flop étant l’unité de mesure de la puissance de calcul – floating-point operations per second), le supercalculateur Jean Zay double ainsi les moyens de calcul disponibles de la France pour la simulation numérique.
Créé en 2007 par les pouvoirs publics, le Genci est une société civile détenue à 49 % par l’État, 20 % par le CEA, 20 % par le CNRS, 10 % par les universités représentées par la Conférence des présidents d’université et 1 % par l’Inria. Son objectif est de démocratiser l’usage de la simulation numérique et du calcul intensif au bénéfice des équipes de recherche académiques et industrielles françaises, ainsi que de représenter la France à l’échelle européenne. La société est chargée de l’investissement en calcul et en stockage des trois centres français hébergeant des supercalculateurs, le Très Grand Centre de calcul du CEA (TGCC) dans l’Essonne, où est installé le supercalculateur Joliot-Curie (9,4 pétaflops/s, étendu à 12,2 pétaflops/s en 2020), le Centre informatique national de l’enseignement supérieur (CINES) à Montpellier, où sont installés le supercalculateur Occigen (3,5 pétaflops/s) et la machine prototype Frioul (164 téraflops/s), ainsi que le Centre de calcul intensif du CNRS à Saclay, où est hébergé, en plus de Jean Zay, la machine prototype Ouessant (260 téraflops/s).
Depuis 2010, le Genci coordonne l’attribution gratuite des heures et des ressources sur les supercalculateurs, répartis sur les trois sites, à destination de la communauté scientifique et industrielle, qui se fait « sur des critères d’excellence scientifique, à partir de projets soumis et évalués lors d’appels à projets », sous réserve de publier les résultats des travaux réalisés grâce à l’allocation d’heures de calcul.
Chaque année, le nombre d’heures demandées augmente plus vite que l’offre en ressource de calcul, ce qui témoigne tout à la fois du dynamisme de la recherche académique ou industrielle française et des mutations des pratiques de l’innovation. En effet, le rapport d’activité de 2018 du Genci explique que « non seulement les entreprises automobiles, pétrolières ou aéronautiques n’envisagent plus de réaliser des crash tests, de mener des campagnes d’explorations, ou de contrôler l’écoulement de l’air sur les ailes d’un avion sans prendre appui sur des simulations numériques, mais les grands groupes et les PME du secteur des nanotechnologies, de la médecine personnalisée ou des énergies renouvelables font désormais appel au calcul intensif ».
Ces supercalculateurs servent à réaliser des « calculs haute performance (HPC) », mais également à répondre aux besoins croissants en termes de calcul dans les nouvelles disciplines comme l’intelligence artificielle, le machine learning (voir La rem n°30-31, p.75), le deep learning, le data mining, ainsi que les applications transverses de l’apprentissage automatique et de l’analyse de données en sciences humaines et sociales. Le nouveau supercalculateur Jean-Zay est une machine dite convergée, ce qui signifie qu’elle peut effectuer des calculs haute performance (HPC) comme des calculs dédiés à l’intelligence artificielle et ses applications, auxquelles il est tout particulièrement destiné.
Pour Frédérique Vidal, ministre de l’enseignement supérieur, de la recherche et de l’innovation, « avoir une ambition mondiale en IA suppose de disposer de moyens de calcul dédiés au meilleur niveau pour développer la recherche en IA car les progrès enregistrés au cours des dernières années résultent de la combinaison d’algorithmes nouveaux, de la disponibilité de jeux de données massives et du décuplement des puissances de calcul ».
L’acquisition de ce supercalculateur s’inscrit dans le cadre des ambitions du gouvernement français, présentées en novembre 2018, de transformer la France en « leader européen de la recherche en intelligence artificielle ». Ces supercalculateurs bénéficient à tous les secteurs industriels et de services, scientifiques comme technologiques, et ils répondent aussi aux grands enjeux de société. C’est pourquoi les scientifiques français regroupés au sein de l’Infrastructure nationale de modélisation du climat, appelée Climeri-France, participent au programme mondial de simulations du climat (CMIP6 – Coupled Model Intercomparison Project) avec deux modèles climatiques, qui serviront à la publication du sixième rapport d’évaluation du Groupe d’experts intergouvernemental sur l’évolution du climat (GIEC), prévue en 2021. Ce travail de modélisation, réunissant des scientifiques de disciplines variées, climatologues, océanographes, glaciologues, spécialistes de l’atmosphère, de la végétation et des sols, et experts en calcul intensif, a déjà nécessité 500 millions d’heures de calcul assurées par les supercalculateurs du Genci et de Météo-France. Il a généré 20 pétaoctets de données.
L’acquisition de ce supercalculateur répond à un enjeu de souveraineté numérique puisque le calcul intensif et la simulation numérique requièrent aujourd’hui des puissances de calcul toujours plus importantes et s’utilisent dorénavant dans des champs scientifiques de plus en plus variés comme l’aéronautique, l’automobile, l’énergie, les matériaux, la biologie et la santé, la sécurité et la défense mais s’appliquent aussi aux voitures autonomes, à la médecine ou encore aux sciences humaines et sociales.
En effet, la course au supercalculateur affichant la plus grande puissance de calcul se joue aujourd’hui essentiellement entre les États-Unis et la Chine (voir La rem n°45, p. 16), même si le programme EuroHPC marque le retour de l’Europe dans la course et affiche dorénavant une volonté de ne plus dépendre du traitement de données hors de l’Union européenne. Comme l’explique Andrus Ansip, ancien vice-président chargé du marché numérique unique à la Commission européenne, « les superordinateurs sont le moteur permettant d’alimenter l’économie numérique ». Or, les moteurs les plus puissants sont actuellement en dehors de l’Europe. Stéphane Requena, directeur technique et innovation au Genci détaille cette ambition européenne appelée Partnership for Advanced Computing in Europe (PRACE) : « Prace, sorte de Genci européen, a ainsi été créé en 2010 grâce notamment aux apports de quatre États membres (Allemagne, France, Italie et Espagne) [100 millions d’euros chacun] mais sans impulsion financière européenne suffisante pour soutenir cette ambition. Cela a changé avec le lancement, fin 2018, de l’initiative européenne EuroHPC dotée d’un milliard d’euros pour sa première phase. Elle coordonne ainsi les efforts de R&D et le déploiement de premiers supercalculateurs de classe mondiale dédiés à la recherche. »
La première phase du programme EuroHPC va permettre d’installer en Espagne, en Italie et en Finlande, trois supercalculateurs dits « pré-exascale », développant une puissance de calcul autour de 200 à 300 pétaflops. La deuxième phase du programme, qui débutera entre 2022 et 2023, aura pour objectif de développer des supercalculateurs dits « exascale » (un exaflop correspondant à un milliard de milliards d’opérations par seconde) pour lesquels l’Allemagne ainsi que la France, à travers le Genci, se sont portées candidates pour héberger l’une de ces machines.
Retrouver une souveraineté numérique autour de ces enjeux fondamentaux permettrait également d’orienter l’innovation différemment des États-Unis et de la Chine. Jamal Atif, chargé de mission « science des données et intelligence artificielle » au CNRS explique qu’il serait possible de « concevoir une IA compétitive, qui génère du business, tout en étant éthique. […] L’Europe peut faire du machine learning qui accroît la confiance, travailler sur la transparence des algorithmes et préparer des IA éthiques, à condition de s’y atteler ».
Sources :
- GENCI, genci.fr
- TERATEC, teratec.eu
- « GENCI : Rapport d’activité 2017 » genci.fr
- « GENCI : Rapport d’activité 2018 » genci.fr
- « Le Genci commande un supercalculateur de 14 pétaflops », Serge Leblal, lemondeinformatique.fr, 8 janvier 2019.
- « Intelligence artificielle : un supercalculateur de 14 pétaflops, à quoi ça sert ? », Rémy Demichelis, lesechos.fr, 19 janvier 2019.
- « Supercalculateurs : la domination des systèmes pétaflopiques », zdnet.fr, 18 juin 2019.
- « Supercalculateurs : les enjeux d’une course planétaire », Anaïs Culot, CNRS – lejournal.cnrs.fr, 9 septembre 2019.
- « Changement climatique : les résultats des nouvelles simulations françaises », CEA, cea.fr, 17 septembre 2019.