option
Maison
Nouvelles
À l'intérieur du bond en IA de Google : Gemini 2.5 réfléchit plus profondément, parle plus intelligemment et code plus rapidement

À l'intérieur du bond en IA de Google : Gemini 2.5 réfléchit plus profondément, parle plus intelligemment et code plus rapidement

7 juin 2025
182

À l

Google se rapproche de sa vision d’un assistant IA universel

Lors de l’événement Google I/O de cette année, l’entreprise a révélé des améliorations significatives de sa série Gemini 2.5, en se concentrant particulièrement sur l’amélioration de ses capacités dans divers domaines. Les dernières versions—Gemini 2.5 Flash et 2.5 Pro—sont désormais plus intelligentes et efficaces que jamais. Ces avancées rapprochent Google de son objectif de créer un assistant IA universel capable de comprendre le contexte, de planifier et d’exécuter les tâches de manière fluide. ### Gemini 2.5 Pro : Repousser les limites de l’intelligence

Gemini 2.5 Pro, présenté par Google comme son modèle le plus avancé à ce jour, affiche une fenêtre de contexte d’un million de tokens sans précédent. Cette fonctionnalité permet à l’IA de traiter de grandes quantités de données et de maintenir la cohérence lors de conversations prolongées. Lors de l’événement, Demis Hassabis, PDG de DeepMind, a exprimé son enthousiasme face aux progrès réalisés, déclarant : « C’est notre objectif ultime pour l’application Gemini : un IA personnelle, proactive et puissante. » L’une des caractéristiques marquantes de Gemini 2.5 Pro est l’introduction du mode « Deep Think », une fonctionnalité expérimentale améliorant les capacités de raisonnement. Deep Think permet à l’IA d’analyser plusieurs hypothèses avant de fournir une réponse, renforçant ainsi ses compétences en prise de décision. Selon Hassabis, ce développement découle des enseignements tirés lors de la création d’AlphaGo, où des temps de traitement plus longs ont conduit à des résultats meilleurs. #### Résultats impressionnants lors des tests de référence

Deep Think a déjà montré des performances remarquables lors de tests de référence difficiles. Par exemple, il a obtenu des scores impressionnants lors du concours olympique américain de mathématiques 2025 (USAMO) et s’est distingué dans LiveCodeBench, un test connu pour évaluer les compétences en codage de haut niveau. De plus, il a obtenu 84,0 % sur MMMU, qui évalue la compréhension et le raisonnement multimodaux. Malgré ces réussites, Google reste prudent. Hassabis a mentionné que l’équipe mène des évaluations approfondies de la sécurité et recueille des retours d’experts avant de déployer Deep Think plus largement. Actuellement, il est accessible aux testeurs privilégiés via l’API pour collecter des commentaires. ### Gemini 2.5 Flash : Un travailleur polyvalent pour l’utilisation quotidienne

Aux côtés de Gemini 2.5 Pro, Google a également introduit une version améliorée de Gemini 2.5 Flash, conçue pour la vitesse, l’efficacité et l’accessibilité. Hassabis l’a décrite comme le « bœuf de labour » de la série, excellant dans les benchmarks pour la raisonnement, la multimodalité, le codage et le contexte long. En fait, elle se classe juste derrière Gemini 2.5 Pro sur le classement LMArena. Le modèle Flash mis à jour est environ 20 à 30 % plus efficace, nécessitant moins de tokens pour accomplir les tâches. Basé sur les retours des développeurs, Google a affiné le modèle et le rend disponible en version bêta dans Google AI Studio, Vertex AI et l’application Gemini. Il sera entièrement déployé en production début juin. ### Nouvelles fonctionnalités pour les deux modèles

Les versions Gemini 2.5 Pro et Flash ont reçu plusieurs nouvelles fonctionnalités visant à améliorer l’interaction utilisateur. La sortie vocale native a été ajoutée pour créer des expériences conversationnelles plus naturelles, tandis que la fonctionnalité de synthèse vocale supporte maintenant plusieurs voix. Les utilisateurs peuvent même guider le ton et le style de la parole, qu’ils veuillent que l’IA sonne dramatique ou solennelle. D’autres fonctionnalités vocales expérimentales incluent le dialogue émotionnel, qui permet à l’IA de reconnaître les émotions dans la voix d’un utilisateur et de répondre en conséquence, ainsi que l’audio proactif, qui filtre le bruit de fond. Les budgets de réflexion ont également été introduits, offrant aux développeurs un contrôle sur la puissance de calcul que l’IA utilise avant de répondre. ### Un pas vers l’avenir

Ces mises à jour soulignent l’engagement de Google à repousser les limites de la technologie IA. Comme Kavukcuoglu et Doshi l’ont noté dans leur billet de blog, « Nous vivons un moment extraordinaire de l’histoire où l’IA rend possible un futur incroyable. C’est un progrès incessant. » Avec ces améliorations, Google pave indubitablement la route vers un avenir où les assistants IA deviendront des compagnons indispensables dans nos vies quotidiennes.

Article connexe
Chatbot Gemini Améliore les Capacités d'Édition d'Images Chatbot Gemini Améliore les Capacités d'Édition d'Images L'application de chatbot Gemini de Google permet désormais aux utilisateurs d'éditer des images générées par IA et téléchargées depuis des téléphones ou des ordinateurs, a annoncé la société dans un b
Google Dévoile Deep Think pour Améliorer les Performances de l'IA Gemini Google Dévoile Deep Think pour Améliorer les Performances de l'IA Gemini Google fait progresser ses modèles d'IA Gemini de premier plan.Lors de Google I/O 2025 mardi, l'entreprise a présenté Deep Think, un mode de raisonnement avancé pour son modèle phare Gemini 2.5 Pro. D
Expérience de vente au détail propulsée par l'IA échoue spectaculairement chez Anthropic Expérience de vente au détail propulsée par l'IA échoue spectaculairement chez Anthropic Imaginez confier un petit magasin à une intelligence artificielle, lui déléguant tout, des prix aux interactions avec les clients. Que pourrait-il arriver de mal ?Une récente étude d'Anthropic, publié
commentaires (0)
0/200
Retour en haut
OR