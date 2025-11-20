Google présente Gemini 3 , un modèle qui, selon la société, établit une nouvelle référence en matière de capacités multimodales et de gestion de très grands contextes , grâce à une fenêtre de 1 million de jetons (déjà présente auparavant). Google présente le Gemini 3 Pro comme le modèle le plus complet de son catalogue, conçu pour combiner texte, images, audio et vidéo dans une seule capacité multimodale (sur le papier, il semble être une réponse à GPT-5 ). L'article met en lumière les résultats obtenus lors de tests de performance publics , utilisés par Google pour démontrer les performances du modèle dans des domaines spécifiques. Gemini 3 surpasse les générations précédentes dans des tests tels que LMArena , qui mesure les compétences générales de complétion, MathArena Apex , qui se concentre sur le raisonnement mathématique, et MMMU-Pro , qui mesure les compétences multimodales. Google ajoute que le modèle gère le contenu vidéo avec plus de précision, comme l'indiquent les résultats sur Video-MMMU . Google introduit également un nouveau mode, appelé Deep Think , conçu pour améliorer la qualité du raisonnement grâce à un traitement étendu. Selon l'entreprise, ce mode permet à Gemini 3 de s'attaquer à des tâches plus structurées, notamment dans les cas d'utilisation nécessitant une analyse complexe ou une vérification étape par étape. Selon Google, Gemini 3 améliore également la qualité des interactions quotidiennes grâce à une compréhension plus précise du contexte étendu , en conservant les informations issues de longues conversations, de réunions transcrites ou de collections de documents, ce qui a un impact direct sur la qualité des réponses fournies aux utilisateurs.
Google confirme que Gemini 3 sera disponible dans l' application Gemini , où il remplacera les modèles précédents pour offrir des interactions plus stables et une assistance plus efficace pour les tâches quotidiennes. Ce modèle sera également intégré au mode IA de la recherche Google , qui exploitera ce nouveau système pour fournir des réponses plus contextualisées lorsque les utilisateurs combinent questions, images et contenu complexe. De nouvelles fonctionnalités de développement sont également disponibles via des plateformes telles que Google AI Studio , Vertex AI et Antigravity . Ces outils complètent Gemini 3 avec des options dédiées à l'analyse, au prototypage et aux applications personnalisées, permettant ainsi aux équipes d'ingénierie d'exploiter ses capacités multimodales et son raisonnement avancé. Google se concentre également sur les aspects de sécurité et de gouvernance , qu'elle affirme avoir renforcés afin de mieux contrôler les capacités du modèle, notamment grâce à son alignement sur le cadre de sécurité Frontiers , qui définit des directives de test et de vérification. Ces mesures visent à rendre l'intégration de Gemini 3 plus fiable dans les produits grand public.
