Méthodes pour l’intégration de données multi-omiques en cellule-unique – scMOmix
Le séquençage de l'ARN en cellule-unique (scRNA-seq) est en train de révolutionner la biologie et la médecine. La possibilité d'évaluer l'hétérogénéité cellulaire à une résolution auparavant inaccessible, a profondément influencé notre compréhension du développement, du fonctionnement du système immunitaire et des nombreuses maladies. Alors que le scRNA-seq est maintenant mature, le développement technologique s'est déplacé vers d'autres mesures quantitatives à grande échelle, appelées "omiques". En plus, des mesures omiques combinées, établies à partir d'une même cellule, sont de plus en plus disponibles.
Chaque donné omique présente des limites intrinsèques et fournit des informations complémentaires sur la même cellule. L'intégration multi-omique, c'est-à-dire l'analyse simultanée de plusieurs omiques en cellule-unique, devrait donc compenser les informations manquantes et fournir un énorme pouvoir pour démêler la complexité des cellules humaines. Cependant, l'intégration des données multi-omiques en cellule-unique est un défi. Les différentes données varient considérablement en termes de portée du signal, de profondeur et de couverture. Le défi consiste donc à extraire les signaux biologiques partagés par les omiques et masqués par les grandes variations existantes entre eux. En plus, le nombre énorme de cellules profilées, qui se chiffrera en milliards dans un avenir proche, présente tous les défis informatiques et statistiques typiques des "Big Data". Il est donc impératif de disposer de méthodologies puissantes et robustes capables de relever ces défis et de produire de nouvelles connaissances biologiques grâce à l'intégration de différentes données.
ScMOmix contribuera à cette percée méthodologique. Notre objectif est de développer des méthodes rigoureuses d'intégration multi-omique capables de surmonter les nombreux défis intrinsèques des données en cellule-unique et d'exploiter leur richesse. Nous proposons en particulier de développer des approches de réduction de la dimensionnalité (WP1) et des approches basées sur les réseaux (WP2) permettant l'intégration de données multi-omiques en cellule-unique et nous convertirons ces méthodes en algorithmes Open Source (WP3). En fin, en appliquant les approches développées à des données réelles provenant de patients, scMOmix vise à améliorer notre compréhension de l'hétérogénéité du cancer et de ses mécanismes moléculaires sous-jacents. Les deux applications dans la recherche sur le cancer que nous considèreront sont: (T1) l'évaluation de l'hétérogénéité des sous-types de cancer colorectal et (T2) l'identification de marqueurs et de mécanismes de résistance pour le traitement de l'a-PD1 dans le mélanome métastatique.
Les méthodologies développées dans le cadre de scMOmix auront un impact sur plusieurs domaines de recherche. Des potentiels utilisateurs de scMOmix sont les biologistes computationnels et les plateformes de séquençage/bio-informatique des hôpitaux ou des centres de recherche. Les scientifiques en mathématiques/machine-learning pourraient étendre les développements méthodologiques de scMOmix à l'analyse de données non-biologiques. Enfin, l'intérêt pour scMOmix ne se limite pas à la sphère universitaire, puisque nous ciblerons également les utilisateurs finaux de l'industrie pharmaceutique et des sociétés d'IA. À long terme, les nouveaux outils proposés dans scMOmix auront un impact aussi sur biologistes et cliniciens, contribuant à la médecine de précision. Toutefois, il aura également un effet sur un large éventail de domaines biologiques, ayant des profils multi-omiques, l'immunologie, des neurosciences, de la recherche environnementale et de la biotechnologie industrielle.
Enfin, ce ANR JCJC contribuera fortement à mon évolution vers la création d’une équipe indépendante. ScMOmix augmentera mes possibilités de postuler favorablement à un ERC starting grant et sera un tremplin pour créer mon propre groupe au sein d'IBENS.
Coordination du projet
Laura Cantini (Institut PASTEUR)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
IBENS Institut de biologie de l'Ecole Normale Supérieure
PASTEUR Institut PASTEUR
Aide de l'ANR 137 974 euros
Début et durée du projet scientifique :
octobre 2020
- 48 Mois