CE45 - Mathématique, informatique, automatique, traitement du signal pour répondre aux défis de la biologie et de la santé

Statistique et Apprentissage pour la génomique en cellules uniques – SingleStatOmics

Résumé de soumission

La quantification à l’échelle du génome entier des phénomènes moléculaires tels l’expression des gènes ou les mutations de l’ADN, à partir de plusieurs milliers de cellules a révolutionné la biologie à la fin des années 90. Ces avancées ont permis par exemple la caractérisation de sous-types de cancers à partir de leur profils moléculaires, ou l’identification de listes de gènes exprimés ou inhibés dans des conditions particulières. Cependant les cellules d’un échantillon ne sont jamais toutes identiques, et les mesures moyennées fournissent une représentation erronée du signal biologique d’intérêt qui varie d’une cellule à une autre. Grâce aux progrès récents et combinés des techniques de séquençage massifs, ainsi que de la biologie cellulaire à haut débit, nous pouvons désormais mesurer, à l’échelle de la cellule unique, des produits moléculaires comme l’ADN, l’ARN, les états de la chromatine, ou même les protéines. L’utilisation de ces techniques de génomique en cellules uniques, nous permet d’étudier cette variabilité inter-cellulaire au sein d’un même échantillon biologique, et d’explorer de nouvelles questions restées inaccessibles avec la génomique classique. Par exemple, l’hétérogénéité est désormais bien établie pour plusieurs types cellulaires, comme les lymphocytes T, les cellules du poumon, ou les précurseurs des myélomes. La construction d’un atlas complet des types cellulaires humain est même à notre portée aujourd’hui. La variabilité inter-cellulaire est également centrale pour de nombreux processus biologiques, tels que la régulation des gène et la différentiation, car elle reflète la nature fondamentalement stochastique de certains phénomènes moléculaires, et renseigne sur les réseaux moléculaires sous-jacents. Cette variabilité joue un rôle important dans le processus de décision cellulaire, et au delà. Par conséquent, mesurer l’expression des gènes par cellule offre des perspectives nouvelles et révolutionnaires sur notre compréhension de la régulation des gènes, et pourrait permettre de résoudre plusieurs anciens débats en biologie. Au delà des aspects expérimentaux, la génomique en cellules uniques soulève de nouveaux défis mathématiques et computationnels. La nature des données produites et les questions émergentes diffèrent de l’approche classique. Par exemple, étant donné la rareté extrême du matériel biologique dans une seule cellule, il est courant d’avoir 90% de données manquantes dans une expérience en cellule unique, et les observations peuvent être corrompues par plusieurs artefacts expérimentaux. L’analyse de ces données nécessite donc de nouveaux développements statistiques. De plus, la quantité de cellules étudiées simultanément par les futures technologies dépassera le million, un ordre de grandeur bien supérieur à ce qui est rencontré traditionnellement, posant des défis immenses de passage à l’échelle pour les méthodes d’analyse. Enfin, de nouvelles questions émergent, comme la modélisation d’un processus de différentiation, ou l’intégration de données génétiques et épigénétiques à l’échelle de la cellule unique, faisant également appel à de nouveaux développements formels. En résumé, de nouveaux outils d’analyse sont nécessaires pour exploiter au mieux les potentialités émergentes de la génomique en cellules uniques. L’objectif de ce projet est d’affronter certains de ces défis, en développant de nouveaux modèles mathématiques et des outils d’analyse pour trois questions biologiques: l’étude de l’hétérogénéité inter-cellulaires et l’identité cellulaire, la modélisation de la dynamique de différentiation cellulaire et la régulation des gènes, l’analyse des données d’épigenomique en cellules uniques. Pour mener à bien ce projet nous avons réuni un consortium autour de compétences en statistique en grande dimension, apprentissage statistique, bioinformatique, biologie des systèmes, ainsi qu’un réseau de collaborateurs spécialistes de la génomique en cellules uniques, en France et à l’étranger.

Coordination du projet

Franck Picard (Laboratoire biologie et modélisation de la cellule)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LBMC UMR 5239 Laboratoire biologie et modélisation de la cellule
LBMC LABORATOIRE DE BIOLOGIE ET MODELISATION DE LA CELLULE
LBBE Laboratoire de biométrie et biologie évolutive
Mathématiques et Informatique Appliquées

Aide de l'ANR 597 435 euros
Début et durée du projet scientifique : February 2019 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter