DS0412 - Innovation médicale, nanotechnologies, médecine régénérative, thérapies et vaccins innovants

Développement de stratégies innovantes ciblant la modulation spécifique de complexes protéine-proteine – PPI-Chem

Développement de stratégies innovantes ciblant la modulation spécifique de complexes protéine-protéine

Nous proposons ici un projet collaboratif entre un partenaire industriel et quatre laboratoires universitaires pour concevoir un outil unique, une chimiothèque focalisée, qui accélérera l'identification de molécules bioactives ciblant les interfaces protéines-protéines.<br /><br />Cette chimiothèque focalisée, composée d'environ 10.000 composés, sera consacrée à l'inhibition des interactions protéines-protéines (PPI).

Un projet collaboratif entre un industriel et 4 laboratoires académiques pour concevoir une chimiothèque focalisée pour accélérer l'identification de hits ciblant les interfaces protéines-protéines

Nous proposons ici un projet collaboratif entre un partenaire industriel (Hybrigenics) et quatre laboratoires universitaires pour concevoir un outil unique, une chimiothèque focalisée d'environ 10,000 composés, qui accélérera l'identification de molécules bioactives ciblant les interfaces protéines-protéines. <br /><br />Une fois validée, cette chimiothèque sera mise à la disposition des laboratoires universitaires, en particulier du réseau français des plateformes académiques de criblage, 'GDR3056 ChemBioScreen', des industries en biotechnologies et des industries pharmaceutiques, par l'intermédiaire d'un MTA écrit par le département de valorisation du CNRS.<br /><br />Certains concepts et méthodes conduisant à la sélection des modulateurs PPI seront également disponibles pour la communauté scientifique. Cet important effort de structuration permettra de réduire le coût de l'identification des nouvelles entités chimiques dans ce domaine très compétitif. <br /><br />Les sondes chimiques qui seront développées fourniront des outils pour étudier les processus biologiques impliquant des interactions protéines-protéines. Certaines d'entre elles seront brevetées et transférées aux industriels. De plus, il faut garder à l'esprit que le projet actuel s'appuie sur plusieurs percées qui sont très susceptibles de se matérialiser en produits et découvertes à fort impact, tels que:<br /><br />1 / Une chimiothèque diverse et unique dédiée aux PPI qui sera mise à disposition de toute la communauté scientifique<br />2 / Publications dans des revues évaluées par des pairs liées à ce travail<br />3 / Nouveaux succès identifiés à partir de la douzaine de HTS qui sera développé pour évaluer la chimiothèque, certains étant publiés comme sondes moléculaires pour étudier les processus biologiques tandis que d'autres conduiront à des programmes de découverte de médicaments<br />4 / Retour sur les investissements pour le partenaire de l'entreprise 'Hybrigenics' qui fournira des services avec cette chimiothèque.

Tâche 1: Préparation de la chimiothèque orientée «Fr-PPI-Chem«.
Préparation du fichier SDF sous-tâche 1.1 (Partenaires 1 et 3)
Des protocoles pour la préparation, la standardisation et le nettoyage des fichiers SDF ont été appliqués à la collection de composés Ambinter et MolPort (partenaire 1) et à la base de données ZINC (partenaire 3).

Sous-tâche 1.2a Mises à jour des filtres PPI (partenaire 1)
85 inhibiteurs orthostériques PPI non redondants provenant de 2P2IDB et 734 médicaments approuvés de la DrugBank ont été recueillis comme jeux positifs et négatifs. Les modèles ont été construits en utilisant différents types de descripteurs moléculaires 2D (MOE 2D, Dragon, ISIDA) et différentes méthodes d'apprentissage (SVM, RF). Les meilleurs modèles ont été sélectionnés. Une validation externe à partir de 2032 composés actifs et 135.315 composés inactifs de la base de données PubChem a été utilisée afin de valider indépendamment nos modèles. Les meilleurs modèles construits démontrent des facteurs d'enrichissement élevés. Un 'Y-Scrambling' a également été effectué pour confirmer que nos modèles n'étaient pas le résultat d'une corrélation fortuite.

Sous-tâche 1.2b Mises à jour des filtres PPI (partenaire 3)
Un jeu de données d'iPPI contenant 3 033 composés (1756 d'iPPI-DB et 1277 de TIMBAL) a été préparé. Nous avons ensuite construit un jeu de référence de 82 382 non-iPPI. 2990 descripteurs moléculaires ont été calculés (MOE, Dragon, RDkit) sur ces deux jeux de données. Nous avons supprimé les descripteurs invariants ou corrélés. En utilisant les 167 descripteurs résultants, quatre méthodes de classification (J48, RF, JRip et SVM) ont été appliquées pour prédire la classe des molécules: iPPI ou non-IPPI. Les paramètres de chaque méthode ont été optimisés. Les modèles ont été choisis sur le meilleur score F1 moyen. La performance des modèles a été évaluée en prévoyant un ensemble de tests (30% des données de départ). Nous avons également effectué un test Y-Scrambling.

Sous-tâche 1.2a Mises à jour des filtres PPI (partenaire 1)
Les modèles finaux ont été utilisés pour filtrer les bases de données des fournisseurs Ambinter et MolPort afin de trouver des inhibiteurs orthostériques compatibles avec nos modèles.
À partir de plus de 12M de composés, nous avons sélectionné 74 376 composés.

Sous-tâche 1.2b Mises à jour des filtres PPI (partenaire 3)
Le meilleur modèle pour chacune des 4 méthodes a été utilisé pour sélectionner dans la base de données ZINC une liste de 143 967 composés.

Sous-tâche 1.3 Mises à jour de la boîte à outils in silico ADMET (Partenaire 3)
Les sélections des partenaires 1 et 3 ont été combinées, les doublons ont été supprimés, conduisant à une collection de 103 656 molécules.
Le logiciel FAF-Drug3 a ensuite été utilisé pour prédire les PAINS et les composés indésirables.
Après plusieurs réunions du consortium un consensus a été proposé. Les composés ont été sélectionnés à condition d'avoir: moins de 6 cycles aromatiques, cycle aromatiques condensés <= 3, liaisons rotatoires <= 20, hétéroatomes <= 12, logP (XlogP3) et logD entre -7 et 8, poids moléculaire > 300 g.mol-1, nombre d'halogènes (Br, I, Cl) < 5 et des composés avec des chaînes alkyles linéaires, le cas échéant, avec moins de 5 CH2 consécutifs. Les composés contenant au moins une des 137 sous-structures associées à la toxicité et ceux contenant au moins l'un des 22 échafaudages PAINS (Filter-A) ont été rejetés. À la fin, cette étape a abouti à la sélection de 78 243 composés.

Sous-tâche 1.4 Analyse de l'espace chimique (partenaire 4)
Une dernière étape a été appliquée pour réduire le nombre de composés et générer une chimiothèque de diversité. Les 78 243 composés ont été regroupés en utilisant des empreintes FCFP6 de Pipeline Pilot avec une dissimilarité Tanimoto <0,3 dans chaque cluster. Les clusters contenant moins de 3 composés ont été éliminés, en tenant compte du potentiel limité de ces composés pour des analyses SAR dans la phase d'optimisation.

Le choix final d'environ 10 à 12 000 composés devrait être prêt dans les prochains jours.
Des devis seront demandées à plusieurs fournisseurs et les composés seront achetés dans les prochaines semaines comme prévu initialement.

Ce programme ANR a permis de rationaliser et d'organiser les laboratoires français en chémoinformatique identifiés comme pionnier dans le domaine de la recherche «Protéines-Protéines«. Grâce à cette réorganisation, nous avons mis en commun notre «savoir-faire» et proposerons bientôt à la communauté scientifique un outil unique, une chimiothèque orientée vers l'inhibition des Interactions Protéines-Protéines, «Fr-PPI-Chem«. Cet outil sera précieux pour la communauté scientifique à la recherche de nouvelles entités chimiques ciblant ces interfaces.

En outre, ce programme ANR et la chimiothèque qui seront distribués «à la demande» ont été présentés à l'école CNRS «Ecole Thématique de Criblage«. Ce programme a été particulièrement apprécié par l'ensemble de la communauté, en attendant que cet important «outil» soit disponible.

Le produit de notre programme ANR, une chimiothèque disponible gratuitement pour la communauté scientifique, est maintenant attendu par les scientifiques du monde entier (au moins en Europe) travaillant sur ce champ excitant de «l'inhibition des interactions protéine-protéine«. Ces scientifiques ont besoin d'appels spécifiques pour les aider dans la prochaine étape: Identifier des hits pour leurs cibles originales.

Notre question à l'ANR: «serait-il possible d'organiser un appel dédié, une application directe de cette chimiothèque- de financer le criblage à haut débit dans les laboratoires et d'accélérer le processus d'identification des Hits - Hit to lead optimization pour ce champ disciplinaire si compétitif? «
Nous sommes prêts à aider l'ANR à organiser cet appel dédié si nécessaire.

N/A

Protein-protein interactions (PPI) play a major role in most biological processes and they are involved in various cell disorders, leading to numerous diseases. As a consequence, PPI have emerged as a new class of very promising therapeutic targets despite being considered as challenging targets mainly due to the nature of the interface that did not evolve to interact with small molecule compounds unlike enzymes or receptors, for example. One of the most effective way to start a drug discovery program targeting PPI, especially when no structural data is available for the target, is high throughput screening (HTS). This strategy relies on the screening of a collection of medium or large size collection of compounds. In addition to the structural and biophysical complexity of the interfacial features of transiently formed complexes, the major hurdle in the field concern the nature of small molecule compounds that are used to search for PPI modulators. The poor hit rate success in drug discovery campaigns is often due to a choice of screening libraries that are not adapted to PPI’s chemical space. There is therefore a major need to develop innovative chemical libraries dedicated to PPI to be shared with the scientific community. Data concerning both PPI targets and their small molecule inhibitors has resulted in the development of dedicated structural databases; two of them being setup and maintained by members of this consortium. Detailed analyses of the physicochemical properties of the small molecule compounds in the respective databases resulted in the definition of a characteristic profile of PPI disruptors that was used to develop dedicated algorithms and select ‘PPI inhibitor-like’ compounds within large collection of compounds.
In this proposal, we offer to build a PPI-oriented chemical library, compatible with drug discovery constraints that will be made public and available to the scientific community as a powerful tool for discovering new biological probes and early hits for the development of potential therapeutic drugs. We will first optimize our current algorithms and tools by taking into account recent results from the screening of our PPI-focused chemical library of 1,664 compounds that was used as a proof of concept as well as current data from our respective databases dedicated to PPI. Some important issues such as solubility of the compounds, physicochemical properties, interference with bioassays, drug-likeness or pharmacokinetics properties will also be considered. This work will result in optimized and standardized protocols that will be applied to various vendors compound collections to build a diverse chemical library of approximately 10,000 compounds that will be purchased, plated and stored. Compounds in the PPI-targeting library will be evaluated for their cytotoxicity on three human cell lines. The focused library will then be evaluated against 10 structurally diverse PPI targets using cell-based or in vitro assays such as homogeneous time-resolved fluorescence (HTRF) and fluorescence polarization technologies (FP). Primary hits will be validated using dose-response bioassays and IC50 will be measured for the best compounds.
This study will first result in improved strategies to select ‘PPI inhibitor-like’ compounds from large collections of small molecules. A validated PPI-oriented chemical library of approximately 10,000 small molecule compounds will be made available through MTA to academic laboratories, screening platforms, biotech’s and pharmaceutical industries. Several chemical probes will be developed during the validation phase of this proposal on 10 biologically important targets. As a direct consequence of this proposal, the large distribution of the library will also stimulate the development of other chemical probes that will provide innovative tools to study biological processes involving protein-protein interactions. Some of these probes may guide new therapeutic developments.

Coordination du projet

Xavier MORELLI (Centre National de la Recherche Scientifique délégation Provence et Corse _ [Centre de Recherche en Cancérologie de Marseille])

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

Hybrigenics services SAS
CEA/DSV/iRTSV/BGE Laboratoire de Biologie à Grande Echelle- Plateforme de Criblage pour des Molécules Bioactives
INSERM_[MTi] Molécules Thérapeutiques in silico
AFMB Laboratoire Architecture et Fonction des Macromolécules Biologiques
ICOA INSTITUT DE CHIMIE ORGANIQUE ET ANALYTIQUE
CNRS DR12 _ [CRCM] Centre National de la Recherche Scientifique délégation Provence et Corse _ [Centre de Recherche en Cancérologie de Marseille]

Aide de l'ANR 524 598 euros
Début et durée du projet scientifique : septembre 2015 - 36 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter