DATAcenter avec Zero Emission de CO2 : un pas plus loin – DATAZERO2
D’un point de vue scientifique, les challenges suivants ont été abordés :
Challenge 1 - Prise en compte de l’incertitude.
Challenge 2 - Système de reconfiguration de la distribution de puissance électrique.
Challenge 3 - Echanger de l’énergie et du calcul.
Challenge 4 - Intégrer une analyse du cycle de vie des centres de données utilisant les énergies renouvelables.
Challenge 5 - Développer un outil de tests pour comprendre les centres de données à énergies renouvelables.
Le Challenge 1 a été la source d'inspiration amenant les solutions pour les challenges suivant.
Le Challenge 2 a été étudié pour diminuer la redondance des matériels électriques tout en assurant une alimentation continue du datacenter.
Pour le Challenge 3, l'approche considérée a été de découpler une partie "Online" d'une partie "Offline". La partie "Offline" travaille sur un horizon à long terme, tentant de maintenir le stock d'énergie initial sur une période donnée, en utilisant des prévisions météo et de charge informatique, et une négociation entre la partie informatique et la partie électrique.
La partie "Online" réagit aux évènements réels (production observée, charge arrivant sur le datacenter) en temps réel.
Pour le Challenge 4, nous avons choisi d'intégrer l'impact des matériels lors de la phase de dimensionnement du datacenter. En effet, c'est dans la phase de production des matériels que la majorité des GES liés au datacenter est émis. D'autre part, la part imputable à l'usage du datactnter est étudiée dans le Challenge 3.
Enfin, pour le Challenge 5, et pour pouvoir intégrer progressivement les travaux réalisés sur les autres challenges, une approche par échanges de messages entre composants a été choisie.
Nous pouvons diviser les résultats en quatre parties : une nouvelle infrastructure électrique pour le Challenge 2, le Dimensionnement pour le challenge 4, l'ITDM, l'ODM pour le challenge 3 et le middleware pour le Challenge 5.
La nouvelle infrastructure électrique consiste à ne se baser que sur des énergies renouvelables. Les éléments la composant (éoliennes, panneaux solaires, piles à combustible hydrogène, électrolyser, batteries) sont connectés dans une microgrid par deux chemins par des interrupteurs pilotés permettant de diriger la puissance électrique sur une entrée ou une autre de l'infrastructure informatique, qui possède une redondance d'alimentation en situation nominale. En cas de problème ou de maintenance d'une partie de l'infrastructure, une reconfiguration dynamique garantit une alimentation continue à la partie informatique.
En ce qui concerne le dimensionnement, le projet propose comment réduire et combattre le surdimensionnement, en montrant que la réduction de la qualité de service de 100 à 95 % réduit de plus de moitié le nombre de serveurs nécessaires, tandis qu'une diminution de 30 % de la capacité de la batterie a un impact négligeable sur l'infrastructure électrique. Un logiciel a été développé.
En ce qui concerne la partie Online, l'ITDM (IT Decision Module) aborde le problème du calcul de la demande de puissance minimale pour traiter une charge de travail sous contrainte de qualité de service. Nous proposons un algorithme de recherche binaire qui nécessite le calcul des configurations de machines avec une puissance de calcul maximale. Un MILP (Mixed-Integer Linear Programming) permet de trouver la solution optimale, et quatre heuristiques donnant des résultats satisfaisants en un temps raisonnable sont proposées. Pour comprendre la demande de puissance nécessaire pour répondre aux exigences des utilisateurs, une méthodologie de caractérisation de la charge de travail a été développée en utilisant une modélisation mathématique et statistique solide, utilisée à son tour pour produire de meilleures prédictions.
Pour la partie Offline, l'ODM (Online Decision Module) propose des politiques de compensation qui adaptent le plan hors ligne en réintroduisant les fluctuations de puissance dans les étapes futures. L'algorithme BEASY utilise des prédictions hors ligne pour estimer les états de charge possibles de la batterie. À l'aide de ces estimations, l'algorithme peut repérer les moments dangereux dans le futur où l'état de charge pourrait être inférieur à un seuil.
Pour le middleware, un logiciel complet a été développé intégrant l'ensemble des éléments nécessaires à l'opération d'un centre de données à énergie renouvelables. Ce logiciel peut simuler en quelques minutes un centre de données opérant sur une année ou plus, en tirant des métriques sur son fonctionnement. Il a été conçu autour d'un bus ActiveMQ et peut être étendu facilement à l'exploitation d'un datacenter en conditions réelles.
En termes de perspectives, la principale à laquelle nous nous attachons est le transfert des logiciels (dimensionnement et middleware) vers des partenaires industriels. Sur le middleware et le logiciel de dimensionnement, une montée en TRL est nécessaire pour leur exploitation commerciale, notamment sur les interfaces hommes-machines.
Sur les perspectives scientifiques qu'il faudrait mener, les principales sont :
- sur le Challenge 2, nous pourrions analyser mathématiquement le rapport entre le niveau de redondance des matériels électrique et le niveau de robustesse de l'infrastructure. Nous savons que ce rapport est inférieur à deux par construction.
-sur le Challenge 3 de l'opération "Offline"-"Online", des travaux supplémentaires pourraient être fait en intégrant plusieurs datacenter répartis géographiquement pouvant s'échanger des travaux informatiques, bénéficiant alors de conditions météorologiques différentes (et donc de production renouvelable différente).
- Sur le Challenge 4 du dimensionnement, nous pourrions prendre en compte, au delà des GES, l'ensemble des impacts écologiques d'un datacenter. Aussi, nous pourrions étudier l'impact du vieillissement des matériels.
Lors de la dernière décennie, plusieurs entreprises et universitaires ont réalisé des recherches sur les possibilités d’utilisation des énergies renouvelables pour diminuer la part importante d’énergies non renouvelables (environ 200 TWh) utilisées dans les centres de données. Des entreprises pionnières ont réussit à alimenter leur centre de données avec des énergies renouvelables (Eolas en France, Emerson Network Power, AISO, Apple, Google, Facebook, Amazon... plus récemment). Cependant, soit l’énergie verte représente une fraction de l’énergie totale utilisée (la consommation mondiale d’énergie renouvelable dans les centres de données représente environ 3 GWh) et l’énergie est en faite produite ailleurs sur un autre site (i.e ils injectent dans le réseau électrique une quantité d’énergie verte équivalente à leur consommation), soit ils achètent des certificats RECS (Renewable Energy Certificates System) à un fournisseur d’électricité qui produit de l’énergie renouvelable. De plus, ils utilisent tous un fournisseur d’énergie externe pour obtenir une redondance. Quelques projets de recherche, comme le projet FP7 GreenDataNet (impliquant le partenaire EATON), ou le projet ANR DATAZERO (impliquant tous les partenaires de DATAZERO2) ont commencé à étudier comment un centre de données principalement alimenté en énergie renouvelable fonctionne.
Depuis 2015 et jusque fin 2019, le projet ANR DATAZERO s’intéresse aux nouvelles manières d’alimenter et de gérer un centre de données UNIQUEMENT alimenté par des énergies renouvelables et du stockage sur site (panneaux photovoltaïques, éoliennes, pile à combustible à hydrogène, batteries, supercaps). Cependant, DATAZERO n’intègre pas suffisamment l’incertitude dans les processus de décisions, se base sur des infrastructures classiques d’alimentation électrique et de refroidissement, et considère un seul centre de données.
Comme premier objectif, DATAZERO2 veut améliorer la gestion et la conception de centres de données opérés UNIQUEMENT avec de l’énergie renouvelable, en utilisant en particulier des approches en rupture pour la gestion de l’incertitude, le refroidissement et la distribution de puissance électrique, et en considérant plusieurs centres de données. Un second objectif est de proposer une base de connaissance et un outil pour l’industrie et les chercheurs pour des centres de données à zéro émission de CO2, au delà de l’état de l’art.
D’un point de vue scientifique, les challenges suivants seront abordés :
Challenge 1 - Prise en compte de l’incertitude.
Challenge 2 - Système de reconfiguration de la distribution de puissance électrique.
Challenge 3 - Refroidissement de centre de données par les technologies hydrogènes.
Challenge 4 - Echanger de l’énergie et du calcul.
Challenge 5 - Intégrer une analyse du cycle de vie des centres de données utilisant les énergies renouvelables.
De plus, DATAZERO2 s’intéressera à un challenge plus technique :
Challenge 6 - Développer un outil de tests pour comprendre les centres de données à énergies renouvelables.
DATAZERO2 fait les mêmes hypothèses qui étaient les forces de DATAZERO: pas de lien avec une alimentation de la grille électrique, un focus sur les centres de données petits et moyens, jusqu’à 1 MW.
DATAZERO2 est un projet multidisciplinaire rassemblant des experts en informatique, électrique, énergie et automatique : UPS-IRIT (informatique), FEMTO-ST avec 3 départements (DISC pour l’informatique, AS2M pour l’automatique, et ENERGIE pour l’énergie et l’électrique), INPT-LAPLACE (pour l’électrique), et EATON SAS, un partenaire industriel spécialisé dans les équipements d’alimentation électrique des centres de données et leurs liens avec l’informatique. DATAZERO2 est construit autour des expertises de DATAZERO et d'une synergie déjà en place qui accélère la compréhension des problèmes à résoudre.
Coordination du projet
Jean-Marc PIERSON (Institut de Recherche en Informatique de Toulouse)
L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.
Partenariat
IRIT Institut de Recherche en Informatique de Toulouse
EATON SAS EATON INDUSTRIES (FRANCE) SAS
FEMTO-ST INSTITUT FRANCHE-COMTE ELECTRONIQUE MECANIQUE THERMIQUE ET OPTIQUE - SCIENCES ET TECHNOLOGIES
LAPLACE LABORATOIRE PLASMA ET CONVERSION D'ENERGIE
Aide de l'ANR 875 594 euros
Début et durée du projet scientifique :
mars 2020
- 42 Mois