CE24 - Micro et nanotechnologies pour le traitement de l’information et la communication

Interconnexions optiques intégrées sur puce pour liens broadcast – OpticALL2

OpticALL2

on-chip OPTIcal interconnect for ALL to ALL communications

Project objectives

The aim of OpticALL² is to design broadcast-enabled optical communication links in manycore architectures. We aim to fabricate an optical broadcast link for which the optical power is equally shared by all the destinations using design techniques (different diode absorption lengths, trade-off depending on the current point in the circuit and the insertion losses). No optical switches will be used, which will allow the link latency to be minimized and will lead to deterministic communication times, which are both key features for efficient cache coherence protocols. The second main objective of OpticALL² is to propose and design a new broadcast-aware cache coherence communication protocol allowing hundreds of computing clusters and memories to be interconnected, which is well adapted to the broadcast-enabled optical communication links. We expect better performance for the parallel execution of benchmark programs, and lower overall power consumption, specifically that due to invalidation or update messages. Furthermore, the absence of silicon ring modulators will allow the implementation of fast laser sources with direct modulation (up to 25Gb/s) with no active thermal tuning and thus lead to interconnects with the high throughput required for high performance computing. The main objectives are:<br />1: Design energy-efficient broadcast-aware nanophotonic interconnect that goes below the 0.1pJ/bit energy consumption barrier for an aggregated 100TB/s total bandwidth.<br />2: Define a broadcast-aware cache coherence communication protocol allowing hundreds of cache memories to be interconnected.<br />3: Fabricate and characterize a chip demonstrator supporting optical broadcast for a manycore architecture.

WP1 - Manycore architecture demonstrator interconnected with developed all-all optical links
WP2 – Application profiling
WP4 - Broadcast link design, fabrication and characterization

CEA-LETI, C2N et INL ont contribué à la réalisation de liens broadcast préliminaires, ainsi que de structures de caractérisation pour des photodétecteurs Si-Ge de très faible empreinte, sur le run de fabrication TRX8 au CEA-LETI.

Un projet utilisant les premiers résultats de OpticALL2 (modèle multi-physique d'élément optique - PCM) a été soumis et accepté par l'ANR (AAPG 2020 – Octane).

- caractérisation du premier démonstrateur
- modélisation des liens caractérisés + intégration dans simulateur comportemental
- génération de trafic dans application manycore
- quantification des bénéfices du lien broadcast optique

1. Min/max time limits and energy penalty of communication scheduling in ring-based ONoC, Joel ORTIZ SOSA, Cedric KILLIAN, Hamza BEN AMMAR and Daniel CHILLET, NoCArc 2020, hal.inria.fr/hal-03032687

La loi de Moore ralentit et l'exploration de dispositifs alternatifs est en cours pour remplacer le transistor CMOS et les architectures traditionnelles au cœur du traitement des données. De plus, l'émergence de contraintes applicatives rigoureuses, notamment celles liées à la consommation d'énergie comme dans les centres de données et le calcul haute performance embarqué (eHPC), nécessite de nouvelles stratégies d'architecture système telles que les approches multi-cœurs et d'adaptabilité opérationnelle en temps réel.
La plupart des architectures multi-cœurs ont adopté un paradigme de communication par mémoire partagée pour simplifier le développement de logiciels. Dans ce paradigme, la cohérence du cache par le matériel garantit que les données répliquées dans les mémoires caches privées restent cohérentes les unes par rapport aux autres. Cela nécessite des communications de type broadcast : les données sont simultanément adressées à N destinations. La réalisation d'une véritable solution de multicast rend possible une architecture entièrement décentralisée, dans laquelle plusieurs copies peuvent être mises à jour simultanément, avec des améliorations de performance potentiellement en rupture.
La cohérence de cache peut passer à l’échelle avec le nombre de cœurs avec une faible surcharge matérielle, mais cela se fait au prix d'une augmentation significative du trafic. Cependant, l'utilisation d'interconnexions classiques nécessite une grande partie des ressources matérielles utilisées pour la communication au lieu du calcul réel, consomme de l'énergie, limite la flexibilité du composant et souffre de l'augmentation des effets de diaphonie et du débit de données limité. Les interconnexions deviennent ainsi le goulot d'étranglement de nombreuses architectures multi-cœurs. Par conséquent, afin de pousser plus loin l'intégration manycore et d'atteindre 0,1pJ/bit sous une bande passante totale agrégée de 100TB/s, la communication au niveau de la puce nécessite une restructuration profonde pour se conformer aux contraintes d'énergie.
La photonique au silicium est un candidat de choix pour y parvenir et des interconnexions nano-photoniques ont été proposées comme solution évolutive pour interconnecter un grand nombre de cœurs. Cependant, les communications optiques sur puce utilisant des guides d'ondes en silicium subissent plus de pertes que les communications par fibre optique (dB/cm vs. dB/km), et nécessitent une optimisation minutieuse des chemins optiques à partir des sources lumineuses, afin de maintenir un rendement énergétique élevé.
L'objectif d'OpticALL² est de concevoir des liaisons de communication optique broadcast-enabled dans les architectures manycore. Nous visons à fabriquer une liaison optique de diffusion dont la puissance optique est partagée de manière égale par toutes les destinations. Aucun résonateur optique ne sera utilisé, ce qui permettra de minimiser la latence de la liaison et conduira à des temps de communication déterministes, deux caractéristiques clés pour des protocoles de cohérence de cache efficaces. Le deuxième objectif d'OpticALL² est de proposer et de concevoir un nouveau protocole de cohérence de cache permettant. De plus, l'absence de modulateurs en anneau permettra la mise en œuvre de sources laser rapides à modulation directe (jusqu'à 25Gb/s), pour lesquels aucune calibration n'est nécessaire, et conduira ainsi à des interconnexions avec le haut débit requis pour le calcul haute performance.
Les principaux objectifs sont :
1 : Concevoir une interconnexion nano-photonique à haute efficacité énergétique qui passe en dessous de la barrière de consommation d'énergie de 0,1pJ/bit pour une bande passante totale de 100TB/s agrégée.
2 : Définir un protocole de cohérence de cache broadcast-aware permettant d'interconnecter des centaines de mémoires cache.
3 : Fabriquer et caractériser un démonstrateur supportant la diffusion optique pour une architecture multi-cœurs.

Coordination du projet

Ian O'Connor (INSTITUT DES NANOTECHNOLOGIES DE LYON)

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.

Partenaire

LETI Commissariat à l'Energie Atomique et aux Energies Alternatives
C2N Centre de Nanosciences et de Nanotechnologies
INL INSTITUT DES NANOTECHNOLOGIES DE LYON
IRISA Institut de Recherche en Informatique et Systèmes Aléatoires
Kalray Kalray S.A.

Aide de l'ANR 573 578 euros
Début et durée du projet scientifique : novembre 2018 - 48 Mois

Liens utiles

Explorez notre base de projets financés

 

 

L’ANR met à disposition ses jeux de données sur les projets, cliquez ici pour en savoir plus.

Inscrivez-vous à notre newsletter
pour recevoir nos actualités
S'inscrire à notre newsletter