CE25 - Sciences et génie du logiciel - Réseaux de communication multi-usages, infrastructures de hautes performances

Comportement temporel sous fautes pour des systèmes critiques sur multicoeurs – FASY

Résumé de soumission

Les industries embarquées critiques, telles que l'avionique, l'automobile, la robotique et la santé, exigent des garanties pour l'exécution correcte d’applications en temps réel stricte. Ces applications deviennent plus en plus complexes, leurs demandes de calcul augmentent, ce qui nécessite des architectures à plusieurs éléments de traitement. Bien que les architectures multicœurs répondent aux besoins des systèmes "best-effort", les problèmes demeurent pour les systèmes critiques, en raison de leur comportement temporel difficile à prévoir et de problèmes de fiabilité.
Le comportement temporel difficile à prévoir est dû à la nature complexe des systèmes modernes, non seulement la complexité des applications, mais aussi celle du matériel augmente. Pour améliorer les performances en moyenne, les architectures modernes ont des composants dynamiques, qui ont toutefois un comportement temporel variable. L'exécution parallèle d'applications sur la même plate-forme entraîne des accès concurrents aux ressources partagées. Ces accès concurrents introduisent des retards (interférences), ce qui affecte fortement le comportement temporel des applications. Pour fournir des garanties de temps réel, des estimations sûres, mais pessimistes, du temps d'exécution dans le pire des cas (WCET) doivent être utilisées pendant la conception du système.
La nature même des systèmes électroniques accroît la vulnérabilité aux fautes. Les menaces pour la fiabilité, telles que la variation du processus de fabrication, le vieillissement et les "soft errors", dépendent de la taille des transistors et augmentent avec la réduction de la taille des transistors. Les fautes les plus importantes sont celles qui se produisent en raison des conditions environnementales, par exemple une température élevée ou un rayonnement électromagnétique à haute énergie. Toutefois, avec la réduction de la taille des transistors, des fautes se produiront même dans des conditions de fonctionnement normales, ce qui n'était pas le cas avec la technologie utilisée il y a dix ans. En raison de cette nature peu fiable des systèmes électroniques, la susceptibilité des architectures multicœurs aux menaces de fiabilité est inévitable.
Cependant, la majorité des approches d'estimation du WCET existantes suppose que le système est exempt de fautes, ce qui rend ces approches peu sûres. D'autres approches appliquent des techniques de tolérance aux fautes pour détecter, corriger ou atténuer les fautes, et étendent le WCET sans faute pour inclure leur surcoût temporel. Cependant, l'accent est mis sur le fait que les fautes matérielles ont un impact sur le comportement fonctionnel des applications. Seules quelques approches traitent de l'impact sur le comportement temporel, mais elles ciblent les composants mémoire, en considérant les défauts permanents dans les caches. Néanmoins, avec la réduction de la taille des technologies, les fautes dans la logique combinatoire et la logique séquentielle des cœurs ne peuvent plus être considérées comme négligeables.
FASY s'attaque aux limitations et challenges mentionnés, en relevant le défi combiné des systèmes embarqués multicœurs fiables et prévisibles, lorsque des fautes se produisent dans les cœurs. Plus précisément, FASY concevra une méthode permettant d'effectuer une analyse réaliste et précise de la vulnérabilité fonctionnelle et temporelle de l'architecture et des applications, y compris les interférences. Cette méthode sera étendue avec une technique d'estimation probabiliste du WCET pour fournir des estimations du WCET tenant compte des fautes. La méthode FASY sera utilisée pour identifier les parties matérielles et logicielles qui ont l'impact le plus élevé et le plus fréquent en cas de défaillance. Des mécanismes de tolérance aux fautes de bas niveau seront conçus pour atténuer l'impact des fautes. FASY repose sur des cœurs open-source, offrant ainsi une meilleure flexibilité, en éliminant les limitations des plates-formes commerciales.

Coordination du projet

Angeliki Kritikakou (Institut de Recherche en Informatique et Systèmes Aléatoires)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

IRISA Institut de Recherche en Informatique et Systèmes Aléatoires

Aide de l'ANR 303 321 euros
Début et durée du projet scientifique : février 2022 - 42 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter