Covid-19. Supercalculateur et calcul distribué

La maladie à coronavirus 2019 – coronavirus provenant du latin « virus à couronne », du fait de sa ressemblance, au microscope électronique, à une couronne solaire – fait l’objet d’une intense mobilisation alliant les chercheurs en médecine et les spécialistes du calcul haute performance (voir La rem n°52, p.31).

Les recherches menées sur un médicament portent sur les possibilités d’inhiber l’infection virale en simulant des molécules susceptibles d’empêcher les protéines du virus de se lier aux cellules humaines. Ces simulations sont modélisées à l’aide de supercalculateurs afin de tester le plus grand nombre possible d’agents inhibants. Selon le CNRS, « le modèle actuel du virus [au 14 avril 2020] comporte jusqu’à cinq millions d’atomes, un chiffre déjà colossal alors que l’objectif est d’atteindre les 250 millions ». Tous les pays du monde disposant de supercalculateurs, dans un élan de mobilisation générale, donnent la priorité aux projets consacrés à la lutte contre la Covid-19. Les résultats de ces calculs et de ces modélisations servent ensuite à orienter des expérimentations biologiques nécessaires à la mise au point d’un vaccin.

Malgré les annonces erratiques du président des États-Unis, le département américain de l’énergie et IBM ont créé, dès le 22 mars 2020, le consortium Covid-19 Calcul à haute performance (Covid-19 High Perfor­mance Computing Consortium), réunissant des laboratoires nationaux de recherche, la NASA, et des partenaires privés comme Microsoft, Hewlett Packard, Google ou encore Amazon, afin de mettre en commun la puissance de seize supercalculateurs affichant une puissance cumulée de 429 pétaflop/s pour accélérer les recherches nécessaires à la mise au point d’un médicament. « Ces systèmes vont permettre aux chercheurs de lancer un nombre très important de calculs dans les domaines de l’épidémiologie, de la bio-informatique et de la modélisation moléculaire. Ces recherches mettraient des mois à aboutir si elles étaient menées sur des ordinateurs traditionnels », expliquait dans un communiqué Dario Gil, directeur de IBM Research. Les chercheurs soumettent, via le site web xsede.org, des propositions de recherche afin qu’elles soient examinées par un groupe d’experts qui les font correspondre aux ressources informatiques d’un ou plusieurs membres du consortium. 46 projets étaient en cours à la mi-mai 2020. Dès mars 2020, des chercheurs du laboratoire national d’Oak Ridge dans le Tennessee, aux États-Unis, ont utilisé le supercalculateur le plus puissant au monde, le Summit d’IBM, pour simuler le compor­tement de quelque 8 000 molécules. Ils en ont ainsi identifiées 77 comme potentiellement compatibles avec l’élaboration d’un futur médicament contre le virus.

En Europe, le Partenariat pour le calcul avancé en Europe (Prace) a lancé, le 24 mars 2020, un appel à propositions en regroupant les supercalculateurs d’Allemagne, de France, d’Italie, d’Espagne et de Suisse, totalisant une puissance cumulée de 150 pétaflop/s. À travers le Grand Équipement national de calcul intensif (GENCI) – société civile détenue par l’État, le Comité d’énergie atomique (CEA), le Centre national de la recherche scientifique (CNRS), la Conférence des présidents d’université et l’Inria (Institut national de recherche en sciences et technologies du numérique) –, la France a mis à la disposition du consortium européen ses trois supercalculateurs : Joliot-Curie, du Très Grand Centre de calcul du CEA (TGCC) ; Jean Zay, de l’Institut du développement et des ressources en informatique scientifique (IDRIS) du CNRS et Occigen, du Centre informatique national de l’enseignement supérieur (CINES) (voir La rem n°52 p.31).

La course à la plus grande puissance de calcul ne passe pas exclusivement par l’utilisation de supercalculateurs. En atteste le projet de calcul distribué, utilisant une constellation d’ordinateurs reliés via l’internet, Folding@home (FAH or F@h), pour simuler des protéines impliquées dans la maladie d’Alzheimer, la drépa­nocytose et certains types de cancers. Créé en octobre 2000 par Vijay Pande, de l’université Stanford en Californie, Folding@home « rassemble des citoyens scientifiques qui se portent volontaires pour effectuer des simulations de la dynamique de protéines sur leur ordinateur personnel. Les données ainsi obtenues aident les scientifiques à mieux comprendre la biologie et offrent de nouvelles possibilités pour le développement de thérapies ». Quiconque souhaite participer au projet doit télécharger sur son ordinateur personnel un logiciel qui en utilisera le processeur ou la carte graphique, dès lors qu’ils ne sont pas sollicités, pour réaliser des calculs en arrière-plan. Le projet Folding@home est développé par le Pande Lab, une structure pluridisciplinaire à but non lucratif émanant du département de chimie de l’université Stanford, qui garantit la mise à disposition des résultats des calculs aux chercheurs et aux scientifiques du monde entier ; il est dorénavant installé au sein de l’école de médecine de l’université de Washington, aux États-Unis. L’analyse des données distribuée sur des milliers d’ordinateurs bénéficie d’une puissance de calcul supérieure aux supercalculateurs les plus puissants au monde.

Depuis février 2020, le projet Folding@Home a concentré ses efforts sur le coronavirus. Bénéficiant d’une forte mobilisation, que ce soit de la part de particuliers mais aussi d’universités ou d’acteurs privés, répartis partout dans le monde, le projet a annoncé le 25 mars 2020 avoir dépassé le seuil symbolique de l’exaFLOP, devenant ainsi plus rapide que les sept premiers superordinateurs du monde cumulés (Voir La rem n°45, p.16). Trois semaines plus tard, le 14 avril 2020, les instigateurs du projet ont fait état d’une puissance de calcul de 2,4 exaFLOP, ce qui équivaut à la puissance cumulée des 500 superordinateurs les plus puissants au monde.

La lutte contre la Covid-19 illustre à quel point le calcul intensif est devenu un enjeu majeur de souveraineté d’un pays. La recherche dans le domaine de la santé nécessite une telle puissance de calcul qu’elle montre aussi combien le modèle du calcul distribué dépasse de très loin les capacités théoriques d’un seul pays et de ses quelques machines.

Sources :

  • « Doit-on dire « le » ou « la » Covid-19 ? », Emma Donada, liberation.fr, 19 mars 2020.
  • « Coronavirus : IBM met ses supercalculateurs à la disposition des chercheurs », Chloé Woitier, lefigaro.fr, 23 mars 2020.
  • « Coronavirus : l’initiative Folding@home surpasse les supercalculateurs », Guerric Poncet, lepoint.fr, 27 mars 2020.
  • « Le supercalculateur Jean ZAY en action contre -le coronavirus », CNRS, cnrs.fr, 10 avril 2020. 
Docteur en sciences de l’information et de la communication, enseignant à l’Université Paris-Panthéon-Assas, responsable des opérations chez Blockchain for Good

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici