Il y a fort à parier qu’IBM vient de dévoiler le schéma directeur du futur de développement de l’IA avec une puce AI analogique qui serait jusqu’à 14 fois plus efficace en matière d’énergie que les composants actuels dominants du secteur.
Un des principaux problèmes de l’IA générative est sa gourmandise en énergie actuellement – et cela pourrait un jour s’accentuer.
Les coûts engendrés par la formation des modèles et le fonctionnement de l’infrastructure ne feront qu’exploser à mesure que l’espace se mature. Par exemple, ChatGPT coûte plus de 700 000 $ par jour à faire fonctionner, selon Insider.
Les progrès chez IBM
La puce prototype d’IBM, que l’entreprise a dévoilé dans Nature, cherche à soulager la pression sur les entreprises qui construisent et exploitent des plateformes IA génératives comme Midjourney ou GPT-4 en réduisant la consommation d’énergie.
Cela est dû à la façon dont la puce analogique est construite ; ces composants diffèrent des puces numériques en ce qu’ils peuvent manipuler des signaux analogiques et comprendre des gradations entre 0 et 1. Les puces numériques sont les plus répandues à l’heure actuelle, mais elles ne fonctionnent qu’avec des signaux binaires distincts. Il existe également des variations dans la fonctionnalité, le traitement des signaux et les domaines d’application.
Les puces de Nvidia, dont le GPU H100 Tensor Core et le GPU A100 Tensor Core, sont principalement les composants qui alimentent de nombreuses plateformes IA génératives d’aujourd’hui. Cependant, si IBM itère sur le prototype et l’optimise pour le marché de masse, elle pourrait un jour supplanter Nvidia en tant que pilier actuel.
Les revendications d’IBM
IBM affirme que sa puce AI analogique 14nm, qui peut encoder 35 millions de dispositifs de mémoire à changement de phase par composant, peut modéliser jusqu’à 17 millions de paramètres. L’entreprise a également déclaré que sa puce imite la façon dont un cerveau humain fonctionnerait, la puce effectuant directement des calculs dans la mémoire.
Elle a démontré les mérites de l’utilisation d’une telle puce dans plusieurs expériences, dont une où un système a pu transcrire l’audio de personnes parlant avec une précision très proche des configurations matérielles numériques.
Le prototype d’IBM était à peu près 14 fois plus efficace par watt, bien que des simulations aient déjà montré que ce type de matériel pourrait être entre 40 et 140 fois plus économe en énergie que les GPU actuels leaders.