Flash Info
CE48 - Fondements du numérique: informatique, automatique, traitement du signal

Algorithmes d'approximation et randomisés pour le traitement de texte – PARSe

Résumé de soumission

Dans ce projet, nous visons à étudier les fondements du traitement de texte à grande échelle. Notre objectif est à comprendre la limite des calculs et à fournir de nouveaux algorithmes et structures de données ultra-efficaces pour le traitement de ces données, inspirés d'approches de hachage et de géométrie à grande dimension. Nous nous concentrerons sur trois axes de recherche : la recherche de motif dans un flot de caractères, l'indexation probabiliste de texte et la comparaison de séquences à base de sketching. Les algorithmes et les structures pour le traitement de texte sont traditionnellement exploités dans des domaines tels que la bioinformatique, la recherche d'information et la sécurité numérique. Nous espérons que notre projet aura un impact significatif sur ces domaines.

Coordination du projet

Tatiana Starikovskaya (Département d'Informatique de l'Ecole Normale Supérieure)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

University of Wroclaw / Institute of Informatics
DI ENS Département d'Informatique de l'Ecole Normale Supérieure
IRISA Institut de Recherche en Informatique et Systèmes Aléatoires
LIRMM Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier

Aide de l'ANR 202 340 euros
Début et durée du projet scientifique : décembre 2020 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter