AccueilMessageLe CPO est-il le véritable signal pour la prochaine étape de l’IA ?Pourquoi les interconnexions GPU sont réécrites

Le CPO est-il le véritable signal pour la prochaine étape de l’IA ?Pourquoi les interconnexions GPU sont réécrites

CPO : Réécriture de l'interconnexion de l'infrastructure de l'IA |Matériel IA de nouvelle génération

Le CPO est-il le véritable signal pour la prochaine étape de l’IA ?
Pourquoi les interconnexions GPU sont réécrites

Lorsque la bande passante d'un seul GPU atteint des niveaux de Tb/s et que les clusters s'étendent jusqu'à des dizaines de milliers de cartes, plusieurs problèmes deviennent douloureusement réels : le cuivre n'est pas assez rapide, la consommation d'énergie est insoutenable, les limitations de distance bloquent l'évolutivité et même l'architecture du système elle-même commence à s'effondrer.

C’est dans ce contexte qu’est née l’optique co-packagée (CPO).

⚡ Vue d'ensemble : Le CPO n'est pas une optimisation de l'interconnexion, c'est un réécriture de l'interconnexion.Il déplace le moteur optique directement à l'intérieur du boîtier, déplaçant ainsi les problèmes traditionnellement résolus au niveau de la carte vers le niveau de la puce.

Au début, je pensais que le CPO n'était qu'une autre itération du module optique.Mais plus on regarde en profondeur, plus cela devient clair.Cela ne réduit pas seulement la consommation d'énergie : il élimine des chemins de transmission électriques entiers.Cela oblige même à repenser les architectures des centres de données, de la topologie du réseau aux méthodes de refroidissement.

CPO n’est pas l’évolution d’un seul composant.Il s’agit d’une restructuration fondamentale de l’ensemble de l’infrastructure informatique.Et c’est peut-être le véritable signal indiquant que l’IA entre dans sa prochaine phase.

1. Qu’est-ce que cela signifie vraiment ?

CPO n’est pas une simple « mise à niveau de module ».Il représente une restructuration complète de l’architecture d’interconnexion pour le calcul de l’IA.

2. Conclusion principale : le goulot d'étranglement est passé du « calcul » à la « connexion »

Dans le passé, les goulots d’étranglement de l’IA concernaient le calcul (GPU).Aujourd'hui, les véritables contraintes sur l'ensemble du système sont : une bande passante insuffisante, une consommation d'énergie excessive et une distance d'interconnexion limitée.Les rapports de l'industrie indiquent désormais clairement que les interconnexions traditionnelles en cuivre + les modules optiques enfichables approchent des limites physiques.

📌Conclusion : Alors que l’IA entre dans sa prochaine étape, le goulot d’étranglement s’est déplacé du « calcul » vers "connexion".

3. L’essence du CPO : intégrer l’optique directement dans l’emballage

CPO fait une chose essentielle : Il regroupe le moteur optique et la puce de commutation.

Les changements fondamentaux que cela apporte :

  • Chemin du signal électrique : de centimètres → micromètres
  • Conversion optique-électrique : du niveau de la carte au niveau du package
  • Structure du système : à partir de modules discrets → haute intégration
📌Résumé en une phrase : L'objectif du CPO n'est pas de « remplacer l'électricité par la lumière ».Il s'agit de redessiner la frontière entre l’électricité et la lumière.

4. Quatre valeurs fondamentales : densité, efficacité, performance et architecture

1️⃣ Haute densité : une augmentation d’un ordre de grandeur

5 à 40
Gbit/s/mm (enfichable)
50-200
Gbit/s/mm (CPO)

Résultat : Amélioration d'environ 10 fois de la bande passante par unité de surface.

2️⃣ Haute efficacité énergétique : >50 % de réduction de puissance

En supprimant les DSP (les plus gros consommateurs d’énergie) et en raccourcissant considérablement le chemin électrique :

~65%
Réduction de puissance (interface optique)
~50%
Économies d'énergie au niveau du système

L’idée clé : Cela n’optimise pas la consommation d’énergie. Cela élimine la source de consommation d’énergie.

3️⃣ Hautes performances : résolution de l'intégrité du signal

Les longues liaisons électriques subissent une forte atténuation du signal.CPO élimine presque toute perte de liaison, permettant la prise en charge des interconnexions SerDes 224G+ et de classe Tb/s.

4️⃣ Restructuration architecturale : simplification au niveau du système

CPO apporte trois changements structurels :

  • Routage de carte simplifié (moins de fibres, moins de connecteurs)
  • Gestion thermique unifiée
  • Complexité système réduite

L'essence : Passer de « l'épissage de modules » à « conception intégrée au système ».

5. Le véritable moteur : la mise à l’échelle, et non la mise à l’échelle traditionnelle

Voici une distinction critique : Le marché principal de CPO n'est pas celui des réseaux évolutifs, mais celui du scale-up.

Pourquoi?La bande passante entre les GPU (par exemple, NVLink à 7,2 Tb/s) augmente si rapidement qu'elle dépasse de loin les capacités des interconnexions Ethernet traditionnelles.

📌Conclusion : Le principal champ de bataille pour les interconnexions de nouvelle génération est connexions à très haut débit au sein d'un seul nœud ou rack.

6. Contraintes du monde réel : le CPO n'est pas gratuit

Aucune technologie n’est parfaite.Le CPO est aujourd’hui confronté à quatre défis majeurs :

  • Flexibilité réduite : Les modules optiques ne peuvent pas être facilement échangés.Le système devient « verrouillé ».
  • Gestion thermique difficile : Les puces haute puissance étroitement couplées aux dispositifs optiques créent des densités thermiques aussi élevées que 500 W/cm².
  • Problèmes de rendement : Le rendement au niveau du système diminue de façon exponentielle.Un seul échec peut détruire l’ensemble du package.
  • Cycles d'itérations incompatibles : La technologie optique évolue rapidement, mais une fois intégrée et intégrée, les mises à niveau deviennent très difficiles.
Résumé en une phrase : Métiers CPO performances au niveau du système pour complexité au niveau du système.

7. Impact sur l’industrie : une restructuration complète de la chaîne de valeur

Le CPO n’est pas une innovation en un seul point.Il restructure toute l’industrie :

  • La valeur remonte vers le haut : Puces photoniques au silicium, lasers, moteurs optiques.
  • Les barrières à l’entrée remontent vers l’amont : Packaging avancé, co-conception et fabrication optoélectroniques.
  • De nouvelles demandes naissent : Systèmes optimisés pour l'IA, solutions de refroidissement liquide.

Le signal clair des rapports de l’industrie : Le CPO devient rapidement la couche technologique fondamentale de la prochaine génération d’infrastructure de calcul d’IA.

CPO Optiques co-packagées Infrastructure d'IA Interconnexion GPU photonique sur silicium scale-up ou scale-out Centre de données IA emballage avancé 1.6T Alternative à NVLink

Basé sur l’analyse des rapports de l’industrie et des tendances actuelles en matière d’infrastructure d’IA.