Google vient de dévoiler Gemini 2.5 Flash, un nouveau modèle d’intelligence artificielle qui permet, pour la première fois, aux développeurs et aux entreprises d’ajuster la capacité de traitement de l’IA selon leurs besoins. Actuellement disponible en avant-première via Google AI Studio et Vertex AI, cette version associe des capacités d’analyse renforcées à une tarification modulable, marquant une nouvelle étape pour s’imposer sur un marché très concurrentiel.
Un “budget de réflexion” pour une IA à la carte
Le modèle introduit la notion de budget de réflexion : l’utilisateur définit la puissance de calcul que l’IA peut mobiliser avant de produire une réponse. Cette approche permet de maîtriser les coûts, tout en optimisant la vitesse et la précision des résultats. « Les développeurs peuvent ainsi adapter l’IA selon leurs besoins : traduction simple ou calculs complexes », explique Tulsee Doshi, responsable produit chez Google DeepMind, dans un entretien accordé à VentureBeat.
Un modèle tarifaire basé sur l’usage réel
La facturation repose sur l’utilisation effective : 0,15 dollar par million de tokens en entrée. En sortie, les coûts varient selon l’activation du raisonnement : 0,60 dollar sans raisonnement, contre 3,50 dollars avec. Ce différentiel illustre le poids en ressources des analyses complexes. Le budget est ajustable de 0 à 24 576 tokens, l’IA déterminant automatiquement l’allocation en fonction de la difficulté de la tâche.
Des performances au rendez-vous
Lors des tests comparatifs, Gemini 2.5 Flash affiche d’excellents résultats : il atteint 12,1 % dans le test Humanity’s Last Exam, surpassant Claude 3.7 Sonnet (8,9 %) et DeepSeek R1 (8,6 %), et se positionne juste derrière OpenAI o4-mini (14,3 %). Sur le test GPQA-Diamond, il obtient 78,3 %, et jusqu’à 88 % en mathématiques. « Ce modèle offre le meilleur équilibre entre performance et coût pour les mathématiques, les tâches multimodales et les contextes longs », souligne Doshi.
Une gestion intelligente des ressources
Les demandes simples, comme « Combien de provinces compte le Canada ? », consomment peu de ressources, ce qui permet de réaliser des économies. Pour les problématiques plus complexes, comme les calculs en physique, l’IA déclenche automatiquement un raisonnement plus poussé. Les entreprises peuvent ainsi réserver les ressources intensives aux cas vraiment stratégiques.
Des outils pour l’enseignement et la création vidéo
Google mise également sur la formation : les étudiants américains bénéficieront jusqu’en 2026 d’un accès gratuit à Gemini Advanced, dans le but de créer un lien dès maintenant. Par ailleurs, les abonnés à Gemini Advanced accèdent à Veo 2, une IA qui permet de générer des vidéos à partir d’instructions textuelles. Une stratégie claire pour rattraper ChatGPT, qui compte aujourd’hui 800 millions d’utilisateurs chaque semaine.
Source : VentureBeat

Je m’appelle Samuel Le Goff. À 38 ans, je suis l’actualité du numérique depuis plus de 14 ans. Aujourd’hui, je m’intéresse particulièrement aux smartphones et aux usages concrets de l’intelligence artificielle, que je traite à travers des contenus clairs et accessibles sur Menow.fr.
