Jalapeño : OpenAI et Broadcom dévoilent leur première puce IA maison, et Nvidia sent la chaleur monter
Tous les articles du blog
Neuf mois. C'est tout ce qu'il a fallu à OpenAI pour concevoir sa première puce IA sur mesure. Jalapeño, présenté le 24 juin avec Broadcom, est un ASIC dédié à l'inférence LLM, pas un GPU polyvalent.
Jalapeño : une puce conçue pour l'inférence, pas pour l'entraînement
La distinction est capitale. L'inférence, c'est chaque réponse ChatGPT, chaque requête Codex, chaque action d'agent IA. L'an dernier, faire tourner les serveurs de ChatGPT a coûté 8,4 milliards de dollars à OpenAI. Avec 900 millions d'utilisateurs hebdomadaires, la facture pourrait atteindre 14 milliards en 2026.
Le CEO de Broadcom, Hock Tan, a annoncé des économies d'environ 50 % par token par rapport aux GPU actuels. OpenAI reste plus prudent, parlant de performances par watt « substantiellement meilleures » que l'état de l'art.
OpenAI veut contrôler tout le stack IA
Le développement, du design initial au tape-out, n'a pris que neuf mois. OpenAI a utilisé ses propres modèles pour accélérer certaines phases de conception. L'IA qui conçoit la puce qui fera tourner l'IA : on vit dans un film de Christopher Nolan.
Les échantillons d'ingénierie exécutent déjà des charges de travail ML en laboratoire, dont GPT-5.3-Codex-Spark. TSMC assure la fabrication, Celestica construit les serveurs. Tan prévoit un déploiement prototype fin 2026, une montée en puissance en 2027 et une pleine capacité début 2028.
Nvidia reste incontournable pour l'entraînement
Ne vous y trompez pas : OpenAI ne divorce pas de Nvidia. Un investissement de 30 milliards de dollars en février 2026, plus un accord pour déployer 10 gigawatts de la plateforme Vera Rubin, maintient Nvidia au cœur du pipeline d'entraînement. Jalapeño ne remplace pas Jensen Huang, il réduit la facture d'inférence.
La réaction boursière a été mesurée. L'action Broadcom a grimpé d'environ 2 %, tandis que Nvidia n'a perdu que 0,26 %. Le marché comprend : c'est un coup de semonce, pas un remplacement. Google a ses TPU, Amazon ses Trainium, Meta ses MTIA, Mistral AI prépare ses propres puces. La course au silicium maison bat son plein.
Pourquoi Jalapeño compte pour vous
Si OpenAI peut réduire ses coûts d'inférence de moitié, les prix de l'API pourraient baisser, les abonnements se stabiliser, et l'accès aux modèles les plus puissants se démocratiser. Pour les développeurs et les entreprises, c'est la promesse concrète qui se cache derrière le nom épicé.