Gemini 3.2 Flash fuite avant Google I/O : plus rapide, moins cher, et déjà monstrueux

6 mai 2026 • Lucas Ferretti • 2 min de lecture

À deux semaines de Google I/O, une version non annoncée de Gemini 3.2 Flash a été repérée simultanément dans l'application iOS de Gemini et sur la plateforme LM Arena. Google n'a rien confirmé. Les utilisateurs ont tout découvert seuls.

Gemini 3.2 Flash : ce que la fuite révèle

Le 5 mai 2026, un utilisateur Reddit a remarqué que le sélecteur de modèle de son app iOS basculait progressivement de Gemini 3 Flash vers 3.1, puis 3.2 Flash. En parallèle, le modèle a été repéré sur Arena AI (anciennement appelé LM Arena) sous forme de tests silencieux. Une double apparition qui ressemble fortement à un déploiement accidentel.

L'interface accompagnant la fuite arbore un nouveau design baptisé « Liquid Glass » : barre de prompt arrondie, fond en gradient animé, et sélecteur de modèle déplacé en haut à gauche. Le mode « Thinking » disparaît au profit d'un toggle de raisonnement global disponible sur tous les modèles.

Des performances qui rivalisent avec Gemini 3.1 Pro

Sur LM Arena, les premiers tests montrent que Gemini 3.2 Flash dépasse son prédécesseur en génération SVG, en coding 3D interactif et en traitement d'animations. Un test viral a demandé la création d'une ville animée en ASCII : 3.2 Flash a produit un résultat fonctionnel en moins de deux minutes, là où 3.1 Pro générait du code cassé en cinq minutes.

Côté prix, les métadonnées API Studio indiquent 0,25 $ par million de tokens en entrée et 2,00 $ en sortie. Soit un tiers de moins que Gemini 3 Flash sur les tokens de sortie. Un modèle Flash qui bat un Pro tout en coûtant moins cher : voilà le vrai titre de cette fuite.

Google I/O 2026 : une annonce imminente

La conférence se tient les 19 et 20 mai. Sur Polymarket, les parieurs donnent 83 % de chances à un lancement avant le 31 mai. Le versionnement en 3.2 plutôt que 3.5 suggère que Google adopte un rythme d'itérations plus rapide, à la manière d'un cycle logiciel continu.

Face à GPT-5.5 d'OpenAI et Claude Opus 4.7 d'Anthropic, Google accélère sur le code IA. Que cette fuite soit un accident ou un teasing bien orchestré, le constat reste le même : le rapport qualité-prix-vitesse des modèles Flash n'a jamais été aussi agressif.

Lucas Ferretti Lucas Ferretti traite des startups IA, des levées de fonds et du business de l'intelligence artificielle pour AIxploria.