Google lance Gemini Omni, une nouvelle famille de modèles d’intelligence artificielle dédiée à la création vidéo. Présenté lors de Google I/O 2026, l’outil peut générer et retoucher des vidéos à partir de texte, d’images, de sons ou même d’autres vidéos. Son ambition est claire : rendre le montage avancé accessible sans logiciel complexe.
Google regroupe ses technologies vidéo dans un seul modèle
Gemini Omni Flash réunit dans un même service plusieurs fonctions déjà vues avec Veo et Nano Banana. Le modèle peut créer des scènes, les modifier et conserver une cohérence visuelle entre différents plans.
Google affirme que son IA est capable d’analyser les mouvements des objets, leur dynamique et leur évolution dans une scène. L’objectif est de produire des vidéos plus stables, plus crédibles et plus faciles à ajuster.
Le service vise aussi une qualité d’image cinématographique. La partie audio n’est pas oubliée : Gemini Omni peut corriger automatiquement la synchronisation du son, des dialogues et des éléments visuels générés.
Des vidéos modifiables en langage naturel
La grande promesse de Gemini Omni tient à son mode d’édition conversationnel. L’utilisateur peut demander à l’IA de modifier une vidéo avec des instructions simples, sans passer par une interface de montage traditionnelle.
Il devient possible de changer un personnage, remplacer un décor, ajuster un style visuel ou modifier une action dans la scène. Tout se fait par commandes en langage naturel.
Cette approche permet à Google d’étendre la logique du montage assisté par conversation à la vidéo multimodale. Le modèle peut ainsi s’appuyer sur plusieurs types de contenus en entrée pour produire ou corriger une séquence.
Gemini Omni mise sur le contexte pour générer des scènes plus cohérentes
Google explique que Gemini Omni utilise les capacités contextuelles de Gemini pour mieux comprendre les demandes. Le modèle peut intégrer des références historiques, scientifiques ou culturelles, puis les transformer en animations.
Cette compréhension du contexte doit aider à limiter les incohérences dans les vidéos générées. Elle peut aussi faciliter la création de séquences plus précises lorsque l’utilisateur demande une ambiance, une période ou un concept particulier.
Toutes les vidéos créées avec Gemini Omni intégreront SynthID, le filigrane numérique de Google destiné à identifier les contenus générés par intelligence artificielle.
Gemini Omni Flash arrive dans Gemini, Flow et bientôt YouTube
Gemini Omni Flash est déployé dès aujourd’hui dans l’application Gemini et sur la plateforme Google Flow. L’accès concerne les abonnés aux offres Google AI Plus, Pro et Ultra.
Google prévoit aussi d’intégrer son nouveau modèle vidéo à YouTube Shorts et à l’application YouTube Create. Cette arrivée pourrait donner aux créateurs des outils de génération et de retouche directement connectés à leurs usages de publication.
Avec Gemini Omni, Google veut simplifier une partie du travail vidéo qui demandait jusque-là des compétences techniques et des logiciels spécialisés. Le montage par texte devient ici le cœur de l’expérience.

Je m’appelle Samuel Le Goff. À 38 ans, je suis l’actualité du numérique depuis plus de 14 ans. Aujourd’hui, je m’intéresse particulièrement aux smartphones et aux usages concrets de l’intelligence artificielle, que je traite à travers des contenus clairs et accessibles sur Menow.fr.
