À l'intérieur du bond en IA de Google : Gemini 2.5 réfléchit plus profondément, parle plus intelligemment et code plus rapidement

Maison

Nouvelles

7 juin 2025

AlbertJackson

194

# Gemini # nlp

À l

Google se rapproche de sa vision d'un assistant IA universel

Lors de l'événement Google I/O de cette année, l'entreprise a révélé des mises à jour importantes de sa série Gemini 2.5, en se concentrant particulièrement sur l'amélioration de ses capacités dans différentes dimensions. Les dernières versions - Gemini 2.5 Flash et 2.5 Pro - sont désormais plus intelligentes et plus efficaces que jamais. Ces avancées rapprochent Google de son objectif de créer un assistant IA universel capable de comprendre le contexte, de planifier et d'exécuter des tâches de manière transparente.

Gemini 2.5 Pro : L'intelligence vers de nouveaux sommets

Gemini 2.5 Pro, présenté par Google comme son modèle le plus avancé à ce jour, dispose d'une fenêtre contextuelle d'un million de mots sans précédent. Cette caractéristique permet à l'IA de traiter de grandes quantités de données et de maintenir la cohérence sur des conversations plus longues. Lors de l'événement, Demis Hassabis, PDG de Google DeepMind, a exprimé son enthousiasme face aux progrès réalisés, en déclarant : "C'est notre objectif ultime pour l'application Gemini : L'une des caractéristiques les plus remarquables de Gemini 2.5 Pro est l'introduction de "Deep Think", un mode de raisonnement expérimental amélioré. Deep Think permet à l'IA d'analyser plusieurs hypothèses avant de fournir une réponse, améliorant ainsi ses capacités de prise de décision. Selon Hassabis, ce développement découle des connaissances acquises lors de la création d'AlphaGo, où des temps de traitement plus longs ont permis d'obtenir de meilleurs résultats.

Des performances impressionnantes dans les tests de référence

Deep Think a déjà fait preuve de performances remarquables lors de tests de référence exigeants. Par exemple, il a obtenu des résultats impressionnants aux Olympiades américaines de mathématiques 2025 (USAMO) et a excellé sur LiveCodeBench, un test connu pour tester les compétences de codage de haut niveau. En outre, il a obtenu un score de 84,0 % à MMMU, qui évalue la compréhension et le raisonnement multimodaux. Malgré ces résultats, Google reste prudent. M. Hassabis a indiqué que l'équipe procédait à des évaluations approfondies de la sécurité et recueillait les commentaires d'experts avant de déployer Deep Think à plus grande échelle. Pour l'instant, les testeurs de confiance peuvent y accéder via l'API à des fins de retour d'information.

Gemini 2.5 Flash : un cheval de bataille pour une utilisation quotidienne

Parallèlement à Gemini 2.5 Pro, Google a également présenté une version améliorée de Gemini 2.5 Flash, conçue pour être rapide, efficace et abordable. M. Hassabis l'a décrite comme le "cheval de bataille" de la série, excellant dans les tests de raisonnement, de multimodalité, de code et de contexte long. Le modèle Flash mis à jour est environ 20 à 30 % plus efficace, nécessitant moins de jetons pour effectuer des tâches. En se basant sur les commentaires des développeurs, Google a affiné le modèle et l'a rendu disponible en avant-première dans Google AI Studio, Vertex AI et l'application Gemini. Il sera entièrement déployé en production au début du mois de juin.

Nouvelles fonctionnalités pour les deux modèles

Gemini 2.5 Pro et Flash ont été dotés de plusieurs nouvelles fonctionnalités visant à améliorer l'interaction avec l'utilisateur. La sortie audio native a été ajoutée pour créer des expériences conversationnelles plus naturelles, tandis que la fonctionnalité de synthèse vocale prend désormais en charge plusieurs voix. Les utilisateurs peuvent même guider le ton et le style de la parole, qu'ils veuillent que l'IA soit mélodramatique ou sombre. D'autres fonctionnalités vocales expérimentales incluent le dialogue affectif, qui permet à l'IA de reconnaître les émotions dans la voix de l'utilisateur et de réagir en conséquence, et l'audio proactif, qui filtre les bruits de fond. Des budgets de réflexion ont également été introduits, permettant aux développeurs de contrôler la puissance de calcul utilisée par l'IA avant de répondre.

Un pas vers l'avenir

Ces mises à jour soulignent l'engagement de Google à repousser les limites de la technologie de l'IA. Comme le soulignent Kavukcuoglu et Doshi dans leur billet de blog, "nous vivons un moment remarquable de l'histoire où l'IA rend possible un nouvel avenir étonnant. Grâce à ces améliorations, Google ouvre sans aucun doute la voie à un avenir où les assistants d'IA deviendront des compagnons indispensables dans notre vie quotidienne.

Article connexe

La personnalisation par l'IA améliore-t-elle la réalité ou la déforme-t-elle ? Les risques cachés explorés La civilisation humaine a déjà été témoin de révolutions cognitives : l'écriture manuscrite a externalisé la mémoire, les calculatrices ont automatisé le calcul, les systèmes GPS ont remplacé l'orient

L'IA Gemini de Google vainc Pokémon Bleu avec de l'aide L'étape clé de l'IA de Google : La conquête d'une aventure Pokémon classiqueLe modèle d'IA le plus avancé de Google semble avoir réalisé une percée notable dans le domaine des jeux vidéo : il a termin

ByteDance Dévoile le Modèle d'IA Seed-Thinking-v1.5 pour Améliorer les Capacités de Raisonnement La course à l'IA avancée en raisonnement a commencé avec le modèle o1 d'OpenAI en septembre 2024, gagnant en élan avec le lancement de R1 par DeepSeek en janvier 2025.Les principaux développeurs d'IA

commentaires (0)

0/200

Soumettre

Top nouvelles

Gemini 2.5 Pro maintenant illimité et moins cher que Claude, GPT-4O Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives Doublage par IA : Guide ultime pour la création de voix réalistes L'IA du cambium transforme le bois de déchet en bois OpenAI améliore l'assistant vocal AI pour de meilleurs chats Comment vous assurer que vos données sont dignes de confiance pour l'intégration de l'IA Notebooklm se développe à l'échelle mondiale, ajoute des diapositives et une vérification des faits améliorée Les ajustements aux centres de données américains pourraient débloquer 76 GW de nouvelle capacité d'énergie Google utilise l'IA pour suspendre plus de 39 millions de comptes d'annonces pour une fraude présumée L'informatique de l'IA pour consommer la puissance de plusieurs New York d'ici 2026, explique le fondateur

Plus

En vedette