CE25 - Sciences et génie du logiciel - Réseaux de communication multi-usages, infrastructures numériques 2024

Accéleration réseau pour l'IA générative – Net4AI

Résumé de soumission

L'accélération réseau pour les grappes de calcul d'IA générative implique l'optimisation de la communication entre plusieurs modèles d'IA, souvent répartis sur différents nœuds. Dans ce contexte, un grand nombre de défis de recherche doivent être relevés. La réduction de la latence est cruciale pour soutenir le parallélisme des modèles et les interactions en temps réel avec les utilisateurs finaux. Le contrôle de l'utilisation de la bande passante est essentiel pour maximiser le débit et minimiser les délais d'exécution des tâches. Au fur et à mesure que la taille des grappes augmente, l'évolutivité est également un défi, car la complexité de la gestion des communications s'accroît. Il est essentiel de veiller à ce que le réseau puisse gérer les défaillances des nœuds avec élégance. Des logiciels utilisant des cadres d'IA optimisés pour des accélérateurs matériels spécifiques permettent d'obtenir de meilleures performances : les grands modèles de langage (LLM) sont si volumineux qu'une grappe de calcul dédiée avec des milliers de GPU est désormais nécessaire à la fois pour l'apprentissage et l'inférence. Pour prendre en charge des modèles de plus en plus grands, le parallélisme des données ne suffit plus et l'on a récemment évolué vers des techniques plus sophistiquées : ces modèles sont divisés en morceaux plus petits et plus faciles à gérer, qui peuvent être distribués sur plusieurs GPU ou TPU. Étant donné qu'un grand nombre de messages, de taille réduite, conjointement avec des ensemble de flux éléphants sont échangés dans ce cadre, une communication efficace entre les appareils est essentielle. Le temps de latence augmente très rapidement dans les grandes grappes, avec le nombre de sauts et la congestion potentielle. Le réseau devient donc un goulot d'étranglement important : Net4AI développera des techniques d'accélération du réseau pour éliminer cette limite et les évaluera de manière globale (accélération, efficacité énergétique).

Coordination du projet

Stefano Secci (Conservatoire National des Arts et Métiers Paris)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenariat

HUAWEI TECHNOLOGIES FRANCE
LS2N Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
SCALNYX SAS
CEDRIC Conservatoire National des Arts et Métiers Paris
LIA AVIGNON UNIVERSITE

Aide de l'ANR 928 473 euros
Début et durée du projet scientifique : mars 2025 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter