Graphes de pangénome pour l'exploration des génomes microbien pilotée par l'IA – PanGAIMiX
Le projet PanGAIMiX, dédié à la microbiologie computationnelle, s'articule autour de quatre axes de recherche innovants.
PanGAIMiX visera tout d’abord à développer des modèles avancés pour les graphes de pangénomes, permettant d'étendre les comparaisons de génomes du niveau des espèces à celui des genres.
Deuxièmement, PanGAIMiX exploitera des méthodes fondées sur les réseaux neuronaux basés sur des graphes pour identifier des contextes génomiques conservés à travers des milliers de pangénomes. Cette approche devrait permettre de délimiter des modules fonctionnels partagés en exploitant les motifs de convolution issus des contraintes évolutives sur les gènes.
Le troisième axe utilisera des grands modèles de langage pour prédire des processus biologiques, tels que des voies métaboliques ou des systèmes de défense. Chaque pangénome sera représenté comme une séquence de phrases, où les mots sont des unités fonctionnelles issues des familles de gènes. Cette approche apprendra les relations complexes entre ces familles à travers différentes espèces, permettant de prédire des fonctions manquantes et de nouveaux processus biologiques.
Finalement, le projet développera PanGBank, une base de données pangénomique exhaustive regroupant les génomes de plus de 40 000 espèces microbiennes qui sera rendue publiquement accessible via une API web. Elle servira à des cas d’utilisation démontrant la pertinence des développements méthodologiques, comme l'étude de la diffusion des gènes de résistance aux antibiotiques dans les bactéries ESKAPEE et la découverte de nouvelles voies métaboliques en explorant des modules de réactions conservés dans les pangénomes.
Appliquées à une large diversité d'espèces, les approches dans PanGAIMiX permettront de dévoiler des schémas évolutifs jusque-là inaccessibles et apporteront de nouvelles perspectives sur l'évolution et le fonctionnement des communautés microbiennes, favorisant des avancées en santé, sciences environnementales et biotechnologie.
Coordination du projet
Alexandra Calteau (COMMISSARIAT À L'ÉNERGIE ATOMIQUE ET AUX ÉNERGIES ALTERNATIVES)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
CEA COMMISSARIAT À L'ÉNERGIE ATOMIQUE ET AUX ÉNERGIES ALTERNATIVES
LaMME Laboratoire de Mathématiques et Modélisation d'Evry
MaIAGE Mathématiques et Informatique Appliquées du Génome à l'Environnement
Aide de l'ANR 609 903 euros
Début et durée du projet scientifique :
novembre 2025
- 48 Mois