
Lors de sa conférence I/O, Google a annoncé deux nouvelles familles de modèles d’intelligence artificielle : Gemini 3.5 et Gemini Omni. Les premiers modèles de chaque gamme sont disponibles dès aujourd’hui pour les utilisateurs.
Ces annonces marquent une avancée sur deux fronts distincts : d’un côté, les capacités de raisonnement et de codage, de l’autre, la création et l’édition de contenu vidéo.
Gemini 3.5 Flash : un modèle polyvalent désormais par défaut
Gemini 3.5 Flash est le premier modèle lancé dans la gamme Gemini 3.5. Il est accessible à tous via l’application Gemini ainsi que dans le mode IA de Google Search, où il remplace désormais le modèle précédent à titre de référence.

Selon Google, ce modèle surpasse Gemini 3.1 Pro sur les tests de codage avancés et les tâches dites agentiques, c’est-à-dire celles où le modèle agit de façon autonome pour accomplir des objectifs complexes. Il se distingue aussi par ses capacités de compréhension multimodale, couvrant texte, images et audio.
La gamme Flash est conçue pour allier performance et rapidité d’exécution, sans sacrifier la précision sur des tâches exigeantes. C’est ce positionnement qui justifie son adoption comme modèle par défaut dans les produits grand public de Google.
Gemini Omni : générer et modifier des vidéos par la conversation
Gemini Omni est une nouvelle famille de modèles conçue spécifiquement pour la génération vidéo. Son premier représentant, Gemini Omni Flash, accepte en entrée des combinaisons de texte, d’images, d’audio et de vidéo pour produire des séquences vidéo de haute qualité.
Une fois une vidéo générée, l’utilisateur peut la modifier par échanges successifs avec le modèle, en ajustant des éléments précis ou l’ensemble du contenu, sans perdre la cohérence visuelle de la scène initiale. Google indique que le modèle dispose d’une meilleure compréhension des lois physiques comme la gravité, l’énergie cinétique ou la dynamique des fluides, ce qui rend les scènes générées plus réalistes.

Omni intègre également la possibilité d’utiliser sa propre voix et de créer des avatars numériques personnalisés. Toutes les vidéos produites sont marquées d’un filigrane numérique via la technologie SynthID de Google, permettant de les identifier comme contenu généré par IA.
Disponibilité et accès
Gemini Omni Flash est disponible dès aujourd’hui pour les abonnés aux plans Google AI Plus, Pro et Ultra, dans l’application Gemini et dans Google Flow. Le déploiement est mondial dès le lancement.
Pour les utilisateurs sans abonnement payant, un accès gratuit est en cours de déploiement via YouTube Shorts et YouTube Create, deux plateformes où la génération de contenu vidéo court est déjà bien implantée.
Ces deux annonces s’inscrivent dans la stratégie de Google visant à intégrer ses modèles IA directement dans ses services existants, qu’il s’agisse de la recherche, de la création de contenu ou des outils pour développeurs.
Source : GSMArena

