IBM annonce une puce 25 fois plus rapide que les autres

Posté le 13 novembre 2023
par Philippe RICHARD dans Informatique et Numérique

L’informatique inspirée par le cerveau (ou BIC pour Brain-inspired computing) est un domaine de recherche interdisciplinaire plein de promesses au vu des dernières puces neuromorphiques mises sur le marché. C’est le cas avec celle d’IBM.

En s’inspirant des mécanismes de traitement de l’information ou des structures des systèmes nerveux biologiques, des chercheurs et des Deeptech ambitionnent d’élaborer des théories fondamentales, des modèles, des architectures matérielles et des systèmes d’application en vue d’une intelligence artificielle (IA) plus efficace et moins énergivore.

Notre cerveau est beaucoup plus économe en énergie que les ordinateurs modernes, en partie parce qu’il stocke la mémoire et le calcul dans chaque neurone. D’où l’idée de s’en inspirer pour développer des puces dites neuromorphiques.

L’idée principale est d’éliminer l’énergie nécessaire au transfert des données entre la mémoire et les puces du processeur. En mélangeant la mémoire et le calcul, on peut aller plus vite et consommer beaucoup moins d’énergie que les architectures traditionnelles de Von Neumann qui séparent le calcul et la mémoire. Cela leur confère un énorme avantage par rapport aux processeurs tensoriels, qui consomment beaucoup d’énergie en déplaçant les données dans le processeur.

C’est l’objectif d’IBM que vient d’annoncer avoir développé une puce qui s’inspirerait du cerveau, baptisée NorthPole, qui est plus de 20 fois plus rapide et environ 25 fois plus économe en énergie que n’importe quelle puce actuellement sur le marché lorsqu’il s’agit de tâches d’intelligence artificielle.

4 000 fois plus rapide !

Cette puce est optimisée pour les opérations de basse précision sur 2, 4 et 8 bits. Selon les chercheurs, cela suffit pour obtenir une précision de pointe sur de nombreux réseaux neuronaux tout en se passant de la haute précision nécessaire à l’entraînement.

Fonctionnant à une fréquence comprise de 25 à 425 mégahertz, le prototype de recherche peut effectuer 2 048 opérations par cœur et par cycle avec une précision de 8 bits, et 8 192 opérations avec une précision de 2 bits.

Selon IBM, NorthPole a également surpassé toutes les autres puces du marché, même celles fabriquées avec des nœuds plus avancés. Par exemple, comparé au GPU H100 de Nvidia, mis en œuvre à l’aide d’un nœud de 4 nm, le NorthPole était cinq fois plus économe en énergie. Et NorthPole s’est avéré environ 4 000 fois plus rapide que TrueNorth, sa précédente puce.

Autre atout significatif, NorthPole n’a pas besoin de systèmes de refroidissement liquide encombrants pour fonctionner. Des ventilateurs et des dissipateurs de chaleur suffisent, ce qui signifie que cette puce pourrait être déployée dans des espaces beaucoup plus restreints.

Comme pour les autres puces neuromorphiques, les applications potentielles de NorthPole peuvent inclure l’analyse d’images et de vidéos, la reconnaissance vocale et les réseaux neuronaux connus sous le nom de transformateurs qui sous-tendent les grands modèles de langage (LLM) qui alimentent les chatbots tels que ChatGPT.

IBM indique aussi que ces tâches d’IA pourraient être utilisées dans les véhicules autonomes, la robotique, les assistants numériques et les observations par satellite.

« Le calcul sur NorthPole n’est pas réellement neuromorphique. Nos dispositifs sont tous établis sur un concept semblable à celui de NorthPole, plaçant la mémoire à proximité du calcul pour éviter l’énergie et le temps nécessaires pour aller chercher les données. Le mode de calcul de nos puces est cependant directement inspiré du cerveau, basé sur une communication événementielle à faible profondeur de bits », nous a précisé Dylan Muir, vice-président des opérations de recherche mondiales chez SynSense, une start-up issue de l’École polytechnique et de l’Université de Zurich et qui développe des puces neuromorphiques.

Pour aller plus loin

Dans l'actualité

Dans les ressources documentaires