Jalapeño : OpenAI et Broadcom dévoilent leur première puce IA maison, et Nvidia sent la chaleur monter

3 min de lecture
Tous les articles du blog
Jalapeño : OpenAI et Broadcom dévoilent leur première puce IA maison, et Nvidia sent la chaleur monter

Neuf mois. C'est tout ce qu'il a fallu à OpenAI pour concevoir sa première puce IA sur mesure. Jalapeño, présenté le 24 juin avec Broadcom, est un ASIC dédié à l'inférence LLM, pas un GPU polyvalent.

Jalapeño : une puce conçue pour l'inférence, pas pour l'entraînement

La distinction est capitale. L'inférence, c'est chaque réponse ChatGPT, chaque requête Codex, chaque action d'agent IA. L'an dernier, faire tourner les serveurs de ChatGPT a coûté 8,4 milliards de dollars à OpenAI. Avec 900 millions d'utilisateurs hebdomadaires, la facture pourrait atteindre 14 milliards en 2026.

Le CEO de Broadcom, Hock Tan, a annoncé des économies d'environ 50 % par token par rapport aux GPU actuels. OpenAI reste plus prudent, parlant de performances par watt « substantiellement meilleures » que l'état de l'art.

OpenAI veut contrôler tout le stack IA

Le développement, du design initial au tape-out, n'a pris que neuf mois. OpenAI a utilisé ses propres modèles pour accélérer certaines phases de conception. L'IA qui conçoit la puce qui fera tourner l'IA : on vit dans un film de Christopher Nolan.

Les échantillons d'ingénierie exécutent déjà des charges de travail ML en laboratoire, dont GPT-5.3-Codex-Spark. TSMC assure la fabrication, Celestica construit les serveurs. Tan prévoit un déploiement prototype fin 2026, une montée en puissance en 2027 et une pleine capacité début 2028.

Hock Tan, PDG de Broadcom, et Greg Brockman, président d'OpenAI, dévoilent Jalapeño sur CNBC.

Nvidia reste incontournable pour l'entraînement

Ne vous y trompez pas : OpenAI ne divorce pas de Nvidia. Un investissement de 30 milliards de dollars en février 2026, plus un accord pour déployer 10 gigawatts de la plateforme Vera Rubin, maintient Nvidia au cœur du pipeline d'entraînement. Jalapeño ne remplace pas Jensen Huang, il réduit la facture d'inférence.

La réaction boursière a été mesurée. L'action Broadcom a grimpé d'environ 2 %, tandis que Nvidia n'a perdu que 0,26 %. Le marché comprend : c'est un coup de semonce, pas un remplacement. Google a ses TPU, Amazon ses Trainium, Meta ses MTIA, Mistral AI prépare ses propres puces. La course au silicium maison bat son plein.

Pourquoi Jalapeño compte pour vous

Si OpenAI peut réduire ses coûts d'inférence de moitié, les prix de l'API pourraient baisser, les abonnements se stabiliser, et l'accès aux modèles les plus puissants se démocratiser. Pour les développeurs et les entreprises, c'est la promesse concrète qui se cache derrière le nom épicé.

LF
Lucas Ferretti Lucas Ferretti traite des startups IA, des levées de fonds et du business de l'intelligence artificielle pour AIxploria.