Google I / S 2024: dévoiler les innovations pour la prochaine génération
Google adopte pleinement ce que nous appelons l'ère Gemini.
Avant de plonger dans les détails, permettez-moi de prendre un moment pour réfléchir à où nous en sommes. Nous investissons des ressources dans l'IA depuis plus d'une décennie, repoussant les limites en matière de recherche, de développement de produits et d'infrastructure. Aujourd'hui, nous allons couvrir tout cela et bien plus encore.
Nous sommes encore au début de ce changement de plateforme vers l'IA, et le potentiel est énorme — pour les créateurs, les développeurs, les startups et tous les autres. C'est ce que représente l'ère Gemini : faire avancer ces opportunités. Alors, commençons directement.
L'ère Gemini
L'année dernière à l'I/O, nous avons dévoilé notre vision pour Gemini : un modèle de pointe conçu pour être nativement multimodal dès le départ, capable de traiter du texte, des images, des vidéos, du code et bien plus encore. C'est un bond significatif vers la transformation de n'importe quelle entrée en n'importe quelle sortie — un "I/O" pour la prochaine génération.
Depuis, nous avons déployé les premiers modèles Gemini, qui ont établi de nouvelles normes en performance multimodale. Seulement deux mois plus tard, nous avons introduit Gemini 1.5 Pro, qui a apporté une avancée majeure dans la gestion des contextes longs. Il peut gérer 1 million de jetons en production, surpassant tout autre modèle de fondation à grande échelle à ce jour.
Nous nous engageons à faire en sorte que tout le monde puisse bénéficier des capacités de Gemini. Nous avons agi rapidement pour partager ces avancées avec vous. Aujourd'hui, plus de 1,5 million de développeurs utilisent les modèles Gemini à travers nos outils, du débogage de code à l'acquisition de nouvelles idées et à la création de la prochaine vague d'applications IA.
Nous intégrons également les puissantes fonctionnalités de Gemini dans nos produits de manière significative. Vous verrez des exemples aujourd'hui à travers Search, Photos, Workspace, Android et au-delà.
Progrès des produits
Actuellement, tous nos produits avec 2 milliards d'utilisateurs sont alimentés par Gemini.
Nous avons également lancé de nouvelles expériences, y compris une application mobile où vous pouvez interagir directement avec Gemini, disponible sur Android et iOS. Et avec Gemini Advanced, vous avez accès à nos modèles les plus avancés. Plus d'un million de personnes se sont inscrites pour l'essayer en seulement trois mois, et l'élan continue de croître.
Expansion des aperçus IA dans Search
L'un des développements les plus excitants avec Gemini a été dans Google Search.
Au cours de l'année dernière, nous avons traité des milliards de requêtes via notre expérience de recherche générative. Les utilisateurs explorent Search de nouvelles manières, posant des questions plus longues et plus complexes, utilisant même des photos pour chercher, et obtenant les meilleurs résultats que le web a à offrir.

Nous avons testé cette expérience au-delà des Labs, et nous sommes ravis de constater non seulement une augmentation de l'utilisation de Search, mais aussi une satisfaction accrue des utilisateurs.
Je suis enthousiaste d'annoncer que nous commencerons à déployer cette expérience entièrement rénovée, les aperçus IA, à tout le monde aux États-Unis cette semaine, avec d'autres pays à suivre bientôt.
Grâce à Gemini, nous repoussons les limites de ce qui est possible dans Search, y compris au sein de nos propres produits.
Présentation de Ask Photos
Prenez Google Photos, par exemple, que nous avons lancé il y a près de neuf ans. C'est devenu une référence pour organiser les souvenirs les plus précieux de la vie, avec plus de 6 milliards de photos et vidéos téléchargées quotidiennement.
Les gens adorent utiliser Photos pour chercher à travers leur vie. Avec Gemini, nous rendons cela encore plus facile.
Imaginez que vous êtes dans un parking et que vous ne vous souvenez plus de votre plaque d'immatriculation. Avant, vous deviez chercher dans Photos avec des mots-clés et défiler à travers des années de photos pour la trouver. Maintenant, vous pouvez simplement demander à Photos. Il reconnaît les voitures que vous utilisez fréquemment, identifie laquelle est la vôtre et vous donne le numéro de la plaque.
Ask Photos peut également vous aider à plonger plus profondément dans vos souvenirs. Disons que vous vous remémorez les premières étapes de votre fille Lucia. Vous pouvez demander à Photos, "Quand Lucia a-t-elle appris à nager ?"
Vous pouvez ensuite enchaîner avec quelque chose de plus complexe, comme, "Montrez-moi comment la natation de Lucia a progressé."

Ici, Gemini va au-delà d'une simple recherche, comprenant différents contextes — des longueurs en piscine à la plongée en apnée dans l'océan, en passant par le texte et les dates sur ses certificats de natation. Photos compile ensuite tout cela en un résumé, vous permettant de revivre ces souvenirs incroyables. Nous déployons Ask Photos cet été, avec d'autres fonctionnalités à venir.
Libérer plus de connaissances avec la multimodalité et le contexte long
La multimodalité de Gemini est conçue pour débloquer des connaissances à travers divers formats. C'est un modèle qui comprend et connecte différents types d'entrées.
Cette approche élargit les types de questions que nous pouvons poser et les réponses que nous recevons. Le contexte long va plus loin, nous permettant de traiter de vastes quantités d'informations : des centaines de pages de texte, des heures d'audio, une heure de vidéo, des dépôts de code entiers, ou même 96 menus de Cheesecake Factory.
Pour ces nombreux menus, vous auriez besoin d'une fenêtre de contexte d'un million de jetons, ce qui est maintenant possible avec Gemini 1.5 Pro. Les développeurs l'utilisent de manière assez cool.

Nous avons déployé Gemini 1.5 Pro avec un contexte long en aperçu au cours des derniers mois, apportant des améliorations de qualité en traduction, codage et raisonnement. Ces mises à jour sont maintenant reflétées dans le modèle.
Je suis ravi d'annoncer que nous rendons cette version améliorée de Gemini 1.5 Pro disponible pour tous les développeurs à l'échelle mondiale. De plus, Gemini 1.5 Pro avec 1 million de contexte est maintenant directement accessible pour les consommateurs dans Gemini Advanced, prenant en charge 35 langues.
Expansion à 2 millions de jetons en aperçu privé
Un million de jetons a ouvert de nouvelles possibilités, mais nous ne nous arrêtons pas là.
Aujourd'hui, nous élargissons la fenêtre de contexte à 2 millions de jetons, disponible pour les développeurs en aperçu privé.
Il est incroyable de voir jusqu'où nous sommes allés en seulement quelques mois. C'est un pas de plus vers notre objectif ultime d'un contexte infini.
Intégration de Gemini 1.5 Pro à Workspace
Nous avons discuté de deux avancées techniques clés : la multimodalité et le contexte long. Chacune est puissante seule, mais ensemble, elles débloquent des capacités et une intelligence encore plus profondes.
Cela est évident dans Google Workspace.
Les gens recherchent souvent leurs emails dans Gmail. Avec Gemini, nous rendons cela beaucoup plus puissant. Par exemple, en tant que parent, vous voulez rester informé des activités scolaires de votre enfant. Gemini peut vous aider à suivre.
Vous pouvez demander à Gemini de résumer les emails récents de l'école. En coulisses, il identifie les emails pertinents et analyse même les pièces jointes comme les PDF. Vous obtenez un résumé des points clés et des actions à entreprendre. Si vous avez manqué la réunion de l'APEL parce que vous voyagiez, et que l'enregistrement dure une heure, Gemini peut mettre en évidence les parties importantes s'il provient de Google Meet. S'il y a un appel à volontaires et que vous êtes libre, Gemini peut rédiger une réponse pour vous.
Il y a d'innombrables façons dont cela peut simplifier votre vie. Gemini 1.5 Pro est disponible aujourd'hui dans Workspace Labs. Aparna partagera plus de détails.
Sorties audio dans NotebookLM
Nous avons vu des exemples avec des sorties textuelles, mais avec un modèle multimodal, nous pouvons faire bien plus.
Nous progressons ici, avec encore plus à venir. Les aperçus audio dans NotebookLM en sont une démonstration. Il utilise Gemini 1.5 Pro pour générer une conversation audio personnalisée et interactive à partir de vos documents sources.
C'est le potentiel de la multimodalité. Bientôt, vous pourrez mélanger et assortir les entrées et les sorties. C'est ce que nous entendons par un "I/O" pour une nouvelle génération. Mais et si nous pouvions aller encore plus loin ?
Une des opportunités excitantes que nous voyons est avec les agents IA. Ce sont des systèmes intelligents qui peuvent raisonner, planifier et se souvenir. Ils peuvent penser plusieurs étapes à l'avance et travailler à travers des logiciels et des systèmes pour accomplir des tâches en votre nom, toujours sous votre supervision.
Nous sommes encore aux débuts, mais permettez-moi de vous donner un aperçu des types de cas d'utilisation sur lesquels nous travaillons.
Prenons le shopping, par exemple. C'est amusant d'acheter des chaussures, mais pas tellement de les retourner si elles ne vont pas.
Imaginez si Gemini pouvait gérer toutes les étapes pour vous :
- Rechercher votre boîte de réception pour le reçu...
- Localiser le numéro de commande dans votre email...
- Remplir un formulaire de retour...
- Même programmer un ramassage UPS.
C'est beaucoup plus facile, non ?
Considérons un scénario plus complexe. Disons que vous venez de déménager à Chicago. Gemini et Chrome peuvent travailler ensemble pour vous aider à vous installer — organiser, raisonner et synthétiser les informations en votre nom.
Vous voudrez explorer la ville et trouver des services locaux, des nettoyeurs à sec aux promeneurs de chiens. Vous devrez également mettre à jour votre nouvelle adresse sur de nombreux sites web.
Gemini peut gérer ces tâches et demandera plus d'informations si nécessaire, en s'assurant que vous restez toujours en contrôle.
C'est crucial — à mesure que nous développons ces expériences, nous nous concentrons sur la confidentialité, la sécurité et leur accessibilité à tous.
Ce sont des exemples simples, mais ils illustrent les types de problèmes que nous visons à résoudre en construisant des systèmes intelligents qui pensent à l'avance, raisonnent et planifient en votre nom.
Ce que cela signifie pour notre mission
La puissance de Gemini — avec sa multimodalité, son contexte long et ses agents — nous rapproche de notre objectif ultime : rendre l'IA utile pour tous.
C'est ainsi que nous ferons le plus de progrès vers notre mission : organiser l'information mondiale à travers chaque entrée, la rendre accessible via n'importe quelle sortie, et combiner l'information mondiale avec l'information de VOTRE monde de manière véritablement utile.
Ouvrir de nouvelles perspectives
Pour réaliser pleinement le potentiel de l'IA, nous devons repousser les limites. L'équipe Google DeepMind travaille dur sur cela.
Nous avons vu beaucoup d'enthousiasme autour de 1.5 Pro et sa fenêtre de contexte longue. Mais les développeurs voulaient aussi quelque chose de plus rapide et plus économique. Ainsi, demain, nous introduisons Gemini 1.5 Flash, un modèle plus léger conçu pour l'échelle. Il est optimisé pour les tâches où la faible latence et le coût sont cruciaux. 1.5 Flash sera disponible dans AI Studio et Vertex AI mardi.
En regardant plus loin, nous avons toujours voulu construire un agent universel utile dans la vie quotidienne. Le projet Astra démontre une compréhension multimodale et des capacités de conversation en temps réel.

Nous avons également fait des progrès dans la génération de vidéos et d'images avec Veo et Imagen 3, et introduit Gemma 2.0, notre prochaine génération de modèles ouverts pour une innovation IA responsable. Vous pouvez en lire plus de Demis Hassabis.
Infrastructure pour l'ère de l'IA : Présentation de Trillium
Entraîner des modèles de pointe nécessite beaucoup de puissance de calcul. La demande pour le calcul ML a augmenté d'un facteur de 1 million au cours des six dernières années, et elle augmente d'un facteur de dix chaque année.
Google a été construit pour cela. Pendant 25 ans, nous avons investi dans une infrastructure technique de classe mondiale, du matériel de pointe qui alimente Search à nos unités de traitement tensoriel personnalisées qui propulsent nos avancées en IA.
Gemini a été entraîné et servi entièrement sur nos TPUs de quatrième et cinquième générations. D'autres entreprises leaders en IA, y compris Anthropic, ont également entraîné leurs modèles sur nos TPUs.
Aujourd'hui, nous sommes ravis d'annoncer notre 6e génération de TPUs, appelée Trillium. Trillium est notre TPU le plus performant et efficace à ce jour, offrant une amélioration de 4,7x en performance de calcul par puce par rapport à la génération précédente, TPU v5e.
Nous rendrons Trillium disponible pour nos clients Cloud fin 2024.
Aux côtés de nos TPUs, nous sommes fiers d'offrir des CPUs et des GPUs pour supporter n'importe quelle charge de travail. Cela inclut les nouveaux processeurs Axion que nous avons annoncés le mois dernier, notre premier CPU basé sur Arm personnalisé qui offre des performances et une efficacité énergétique de pointe dans l'industrie.
Nous sommes également l'un des premiers fournisseurs Cloud à offrir les GPUs Blackwell de pointe de Nvidia, disponibles début 2025. Notre partenariat de longue date avec NVIDIA nous permet d'apporter les capacités révolutionnaires de Blackwell à nos clients.
Les puces sont une partie fondamentale de notre système intégré de bout en bout, du matériel optimisé pour la performance et des logiciels ouverts aux modèles de consommation flexibles. Tout cela converge dans notre AI Hypercomputer, une architecture de superordinateur révolutionnaire.
Les entreprises et les développeurs l'utilisent pour relever des défis plus complexes, avec plus de deux fois l'efficacité par rapport à l'achat de matériel brut et de puces. Nos avancées dans l'AI Hypercomputer sont rendues possibles en partie grâce à notre approche du refroidissement liquide dans nos centres de données.
Nous faisons cela depuis près d'une décennie, bien avant que cela ne devienne la norme pour l'industrie. Aujourd'hui, notre capacité totale de flotte déployée pour les systèmes de refroidissement liquide est proche de 1 gigawatt et en croissance — c'est près de 70 fois la capacité de toute autre flotte.
Sous-jacent à cela se trouve l'échelle pure de notre réseau, qui connecte notre infrastructure à l'échelle mondiale. Notre réseau s'étend sur plus de 2 millions de miles de fibre terrestre et sous-marine : plus de 10 fois la portée du prochain fournisseur cloud leader.
Nous continuerons à faire les investissements nécessaires pour faire avancer l'innovation en IA et fournir des capacités de pointe.

Le chapitre le plus excitant de Search à ce jour
L'un de nos plus grands domaines d'investissement et d'innovation est notre produit fondateur, Search. Il y a 25 ans, nous avons créé Search pour aider les gens à naviguer dans le flot d'informations qui passait en ligne.
À chaque changement de plateforme, nous avons livré des percées pour mieux répondre à vos questions. Sur mobile, nous avons déverrouillé de nouveaux types de questions et de réponses — en utilisant un meilleur contexte, une conscience de la localisation et des informations en temps réel. Avec les avancées dans la compréhension du langage naturel et la vision par ordinateur, nous avons permis de nouvelles façons de chercher, comme utiliser votre voix ou fredonner pour trouver votre nouvelle chanson préférée, ou utiliser une image de cette fleur que vous avez vue lors de votre promenade. Et maintenant, vous pouvez même Cercle pour chercher ces nouvelles chaussures cool que vous pourriez vouloir acheter. Allez-y, vous pouvez toujours les retourner !
Bien sûr, Search dans l'ère Gemini portera cela à un tout autre niveau, combinant nos forces en infrastructure, les dernières capacités d'IA, nos normes élevées pour la qualité de l'information, et nos décennies d'expérience à vous connecter à la richesse du web. Le résultat est un produit qui fait le travail pour vous.
Google Search est l'IA générative à l'échelle de la curiosité humaine. Et c'est notre chapitre le plus excitant de Search à ce jour. En savoir plus sur l'ère Gemini de Search de Liz Reid.
Expériences Gemini plus intelligentes
Gemini est plus qu'un simple chatbot ; il est conçu pour être votre assistant personnel utile qui peut s'attaquer à des tâches complexes et agir en votre nom.
Interagir avec Gemini devrait sembler conversationnel et intuitif. Ainsi, nous annonçons une nouvelle expérience Gemini appelée Live, qui vous permet d'avoir une conversation approfondie avec Gemini en utilisant votre voix. Nous apporterons également 2M de jetons à Gemini Advanced plus tard cette année, rendant possible le téléchargement et l'analyse de fichiers très denses comme des vidéos et du code long. Sissie Hsiao partage plus de détails.
Gemini sur Android
Avec des milliards d'utilisateurs Android dans le monde, nous sommes ravis d'intégrer Gemini plus profondément dans l'expérience utilisateur. En tant que votre nouvel assistant IA, Gemini est là pour vous aider à tout moment, n'importe où. Nous avons incorporé les modèles Gemini dans Android, y compris notre dernier modèle sur appareil : Gemini Nano avec Multimodalité, qui traite le texte, les images, l'audio et la parole pour déverrouiller de nouvelles expériences tout en gardant les informations privées sur votre appareil. Sameer Samat partage les nouvelles Android ici.
Notre approche responsable de l'IA
Nous continuons à aborder l'opportunité de l'IA avec audace, avec un sentiment d'excitation. Nous nous assurons également de le faire de manière responsable. Nous développons une technique de pointe appelée red teaming assisté par IA, qui s'appuie sur les percées de Google DeepMind dans les jeux comme AlphaGo pour améliorer nos modèles. De plus, nous avons étendu SynthID, notre outil de filigrane qui facilite l'identification du contenu généré par IA, à deux nouvelles modalités : le texte et la vidéo. James Manyika partage plus.
Créer l'avenir ensemble
Tout cela montre les progrès importants que nous réalisons en adoptant une approche audacieuse et responsable pour rendre l'IA utile pour tous.
Nous sommes centrés sur l'IA depuis longtemps. Nos décennies de leadership en recherche ont ouvert la voie à de nombreuses percées modernes qui propulsent les progrès de l'IA, pour nous et pour l'industrie. En plus de cela, nous avons :
- Une infrastructure de pointe construite pour l'ère de l'IA
- Une innovation de pointe dans Search, maintenant alimentée par Gemini
- Des produits qui aident à une échelle extraordinaire — y compris 15 produits avec un demi-milliard d'utilisateurs
- Et des plateformes qui permettent à tous — partenaires, clients, créateurs, et vous tous — d'inventer l'avenir.
Ce progrès n'est possible que grâce à notre incroyable communauté de développeurs. Vous le rendez réel, à travers les expériences et les applications que vous construisez chaque jour. Alors, à tous ceux ici à Shoreline et aux millions d'autres qui regardent dans le monde entier, voici aux possibilités à venir et à leur création ensemble.

Recevez plus d'histoires de Google dans votre boîte de réception.
Adresse e-mail Vos informations seront utilisées conformément à la politique de confidentialité de Google.
S'abonner Terminé. Encore une étape.
Vérifiez votre boîte de réception pour confirmer votre abonnement.
Vous êtes déjà abonné à notre newsletter.
Vous pouvez également vous abonner avec une autre adresse e-mail.
Article connexe
Salesforce Dévoile des Coéquipiers Numériques IA dans Slack pour Rivaliser avec Microsoft Copilot
Le nouvel outil, Agentforce dans Slack, permet aux entreprises de créer et de déployer des agents IA spécifiques à des tâches qui recherchent dans les discussions professionnelles, accèdent aux donnée
Investissement de 40 milliards de dollars d'Oracle dans les puces Nvidia pour renforcer le centre de données IA au Texas
Oracle prévoit d'investir environ 40 milliards de dollars dans des puces Nvidia pour alimenter un nouveau centre de données majeur au Texas, développé par OpenAI, selon le Financial Times. Cette trans
Application Meta AI pour introduire un niveau premium et des publicités
L'application d'IA de Meta pourrait bientôt proposer un abonnement payant, à l'image des offres de concurrents comme OpenAI, Google et Microsoft. Lors d'une conférence sur les résultats du premier tri
commentaires (27)
0/200
FredGreen
21 août 2025 09:01:19 UTC+02:00
Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎
0
TimothyHernández
8 août 2025 15:00:59 UTC+02:00
Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎
0
AlbertRodriguez
25 avril 2025 00:33:43 UTC+02:00
Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀
0
StevenNelson
24 avril 2025 08:18:04 UTC+02:00
Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀
0
MatthewGonzalez
23 avril 2025 18:59:25 UTC+02:00
O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀
0
ScottWalker
22 avril 2025 14:54:29 UTC+02:00
Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀
0
Google adopte pleinement ce que nous appelons l'ère Gemini.
Avant de plonger dans les détails, permettez-moi de prendre un moment pour réfléchir à où nous en sommes. Nous investissons des ressources dans l'IA depuis plus d'une décennie, repoussant les limites en matière de recherche, de développement de produits et d'infrastructure. Aujourd'hui, nous allons couvrir tout cela et bien plus encore.
Nous sommes encore au début de ce changement de plateforme vers l'IA, et le potentiel est énorme — pour les créateurs, les développeurs, les startups et tous les autres. C'est ce que représente l'ère Gemini : faire avancer ces opportunités. Alors, commençons directement.
L'ère Gemini
L'année dernière à l'I/O, nous avons dévoilé notre vision pour Gemini : un modèle de pointe conçu pour être nativement multimodal dès le départ, capable de traiter du texte, des images, des vidéos, du code et bien plus encore. C'est un bond significatif vers la transformation de n'importe quelle entrée en n'importe quelle sortie — un "I/O" pour la prochaine génération.
Depuis, nous avons déployé les premiers modèles Gemini, qui ont établi de nouvelles normes en performance multimodale. Seulement deux mois plus tard, nous avons introduit Gemini 1.5 Pro, qui a apporté une avancée majeure dans la gestion des contextes longs. Il peut gérer 1 million de jetons en production, surpassant tout autre modèle de fondation à grande échelle à ce jour.
Nous nous engageons à faire en sorte que tout le monde puisse bénéficier des capacités de Gemini. Nous avons agi rapidement pour partager ces avancées avec vous. Aujourd'hui, plus de 1,5 million de développeurs utilisent les modèles Gemini à travers nos outils, du débogage de code à l'acquisition de nouvelles idées et à la création de la prochaine vague d'applications IA.
Nous intégrons également les puissantes fonctionnalités de Gemini dans nos produits de manière significative. Vous verrez des exemples aujourd'hui à travers Search, Photos, Workspace, Android et au-delà.
Progrès des produits
Actuellement, tous nos produits avec 2 milliards d'utilisateurs sont alimentés par Gemini.
Nous avons également lancé de nouvelles expériences, y compris une application mobile où vous pouvez interagir directement avec Gemini, disponible sur Android et iOS. Et avec Gemini Advanced, vous avez accès à nos modèles les plus avancés. Plus d'un million de personnes se sont inscrites pour l'essayer en seulement trois mois, et l'élan continue de croître.
Expansion des aperçus IA dans Search
L'un des développements les plus excitants avec Gemini a été dans Google Search.
Au cours de l'année dernière, nous avons traité des milliards de requêtes via notre expérience de recherche générative. Les utilisateurs explorent Search de nouvelles manières, posant des questions plus longues et plus complexes, utilisant même des photos pour chercher, et obtenant les meilleurs résultats que le web a à offrir.
Nous avons testé cette expérience au-delà des Labs, et nous sommes ravis de constater non seulement une augmentation de l'utilisation de Search, mais aussi une satisfaction accrue des utilisateurs.
Je suis enthousiaste d'annoncer que nous commencerons à déployer cette expérience entièrement rénovée, les aperçus IA, à tout le monde aux États-Unis cette semaine, avec d'autres pays à suivre bientôt.
Grâce à Gemini, nous repoussons les limites de ce qui est possible dans Search, y compris au sein de nos propres produits.
Présentation de Ask Photos
Prenez Google Photos, par exemple, que nous avons lancé il y a près de neuf ans. C'est devenu une référence pour organiser les souvenirs les plus précieux de la vie, avec plus de 6 milliards de photos et vidéos téléchargées quotidiennement.
Les gens adorent utiliser Photos pour chercher à travers leur vie. Avec Gemini, nous rendons cela encore plus facile.
Imaginez que vous êtes dans un parking et que vous ne vous souvenez plus de votre plaque d'immatriculation. Avant, vous deviez chercher dans Photos avec des mots-clés et défiler à travers des années de photos pour la trouver. Maintenant, vous pouvez simplement demander à Photos. Il reconnaît les voitures que vous utilisez fréquemment, identifie laquelle est la vôtre et vous donne le numéro de la plaque.
Ask Photos peut également vous aider à plonger plus profondément dans vos souvenirs. Disons que vous vous remémorez les premières étapes de votre fille Lucia. Vous pouvez demander à Photos, "Quand Lucia a-t-elle appris à nager ?"
Vous pouvez ensuite enchaîner avec quelque chose de plus complexe, comme, "Montrez-moi comment la natation de Lucia a progressé."
Ici, Gemini va au-delà d'une simple recherche, comprenant différents contextes — des longueurs en piscine à la plongée en apnée dans l'océan, en passant par le texte et les dates sur ses certificats de natation. Photos compile ensuite tout cela en un résumé, vous permettant de revivre ces souvenirs incroyables. Nous déployons Ask Photos cet été, avec d'autres fonctionnalités à venir.
Libérer plus de connaissances avec la multimodalité et le contexte long
La multimodalité de Gemini est conçue pour débloquer des connaissances à travers divers formats. C'est un modèle qui comprend et connecte différents types d'entrées.
Cette approche élargit les types de questions que nous pouvons poser et les réponses que nous recevons. Le contexte long va plus loin, nous permettant de traiter de vastes quantités d'informations : des centaines de pages de texte, des heures d'audio, une heure de vidéo, des dépôts de code entiers, ou même 96 menus de Cheesecake Factory.
Pour ces nombreux menus, vous auriez besoin d'une fenêtre de contexte d'un million de jetons, ce qui est maintenant possible avec Gemini 1.5 Pro. Les développeurs l'utilisent de manière assez cool.
Nous avons déployé Gemini 1.5 Pro avec un contexte long en aperçu au cours des derniers mois, apportant des améliorations de qualité en traduction, codage et raisonnement. Ces mises à jour sont maintenant reflétées dans le modèle.
Je suis ravi d'annoncer que nous rendons cette version améliorée de Gemini 1.5 Pro disponible pour tous les développeurs à l'échelle mondiale. De plus, Gemini 1.5 Pro avec 1 million de contexte est maintenant directement accessible pour les consommateurs dans Gemini Advanced, prenant en charge 35 langues.
Expansion à 2 millions de jetons en aperçu privé
Un million de jetons a ouvert de nouvelles possibilités, mais nous ne nous arrêtons pas là.
Aujourd'hui, nous élargissons la fenêtre de contexte à 2 millions de jetons, disponible pour les développeurs en aperçu privé.
Il est incroyable de voir jusqu'où nous sommes allés en seulement quelques mois. C'est un pas de plus vers notre objectif ultime d'un contexte infini.
Intégration de Gemini 1.5 Pro à Workspace
Nous avons discuté de deux avancées techniques clés : la multimodalité et le contexte long. Chacune est puissante seule, mais ensemble, elles débloquent des capacités et une intelligence encore plus profondes.
Cela est évident dans Google Workspace.
Les gens recherchent souvent leurs emails dans Gmail. Avec Gemini, nous rendons cela beaucoup plus puissant. Par exemple, en tant que parent, vous voulez rester informé des activités scolaires de votre enfant. Gemini peut vous aider à suivre.
Vous pouvez demander à Gemini de résumer les emails récents de l'école. En coulisses, il identifie les emails pertinents et analyse même les pièces jointes comme les PDF. Vous obtenez un résumé des points clés et des actions à entreprendre. Si vous avez manqué la réunion de l'APEL parce que vous voyagiez, et que l'enregistrement dure une heure, Gemini peut mettre en évidence les parties importantes s'il provient de Google Meet. S'il y a un appel à volontaires et que vous êtes libre, Gemini peut rédiger une réponse pour vous.
Il y a d'innombrables façons dont cela peut simplifier votre vie. Gemini 1.5 Pro est disponible aujourd'hui dans Workspace Labs. Aparna partagera plus de détails.
Sorties audio dans NotebookLM
Nous avons vu des exemples avec des sorties textuelles, mais avec un modèle multimodal, nous pouvons faire bien plus.
Nous progressons ici, avec encore plus à venir. Les aperçus audio dans NotebookLM en sont une démonstration. Il utilise Gemini 1.5 Pro pour générer une conversation audio personnalisée et interactive à partir de vos documents sources.
C'est le potentiel de la multimodalité. Bientôt, vous pourrez mélanger et assortir les entrées et les sorties. C'est ce que nous entendons par un "I/O" pour une nouvelle génération. Mais et si nous pouvions aller encore plus loin ?
Une des opportunités excitantes que nous voyons est avec les agents IA. Ce sont des systèmes intelligents qui peuvent raisonner, planifier et se souvenir. Ils peuvent penser plusieurs étapes à l'avance et travailler à travers des logiciels et des systèmes pour accomplir des tâches en votre nom, toujours sous votre supervision.
Nous sommes encore aux débuts, mais permettez-moi de vous donner un aperçu des types de cas d'utilisation sur lesquels nous travaillons.
Prenons le shopping, par exemple. C'est amusant d'acheter des chaussures, mais pas tellement de les retourner si elles ne vont pas.
Imaginez si Gemini pouvait gérer toutes les étapes pour vous :
- Rechercher votre boîte de réception pour le reçu...
- Localiser le numéro de commande dans votre email...
- Remplir un formulaire de retour...
- Même programmer un ramassage UPS.
C'est beaucoup plus facile, non ?
Considérons un scénario plus complexe. Disons que vous venez de déménager à Chicago. Gemini et Chrome peuvent travailler ensemble pour vous aider à vous installer — organiser, raisonner et synthétiser les informations en votre nom.
Vous voudrez explorer la ville et trouver des services locaux, des nettoyeurs à sec aux promeneurs de chiens. Vous devrez également mettre à jour votre nouvelle adresse sur de nombreux sites web.
Gemini peut gérer ces tâches et demandera plus d'informations si nécessaire, en s'assurant que vous restez toujours en contrôle.
C'est crucial — à mesure que nous développons ces expériences, nous nous concentrons sur la confidentialité, la sécurité et leur accessibilité à tous.
Ce sont des exemples simples, mais ils illustrent les types de problèmes que nous visons à résoudre en construisant des systèmes intelligents qui pensent à l'avance, raisonnent et planifient en votre nom.
Ce que cela signifie pour notre mission
La puissance de Gemini — avec sa multimodalité, son contexte long et ses agents — nous rapproche de notre objectif ultime : rendre l'IA utile pour tous.
C'est ainsi que nous ferons le plus de progrès vers notre mission : organiser l'information mondiale à travers chaque entrée, la rendre accessible via n'importe quelle sortie, et combiner l'information mondiale avec l'information de VOTRE monde de manière véritablement utile.
Ouvrir de nouvelles perspectives
Pour réaliser pleinement le potentiel de l'IA, nous devons repousser les limites. L'équipe Google DeepMind travaille dur sur cela.
Nous avons vu beaucoup d'enthousiasme autour de 1.5 Pro et sa fenêtre de contexte longue. Mais les développeurs voulaient aussi quelque chose de plus rapide et plus économique. Ainsi, demain, nous introduisons Gemini 1.5 Flash, un modèle plus léger conçu pour l'échelle. Il est optimisé pour les tâches où la faible latence et le coût sont cruciaux. 1.5 Flash sera disponible dans AI Studio et Vertex AI mardi.
En regardant plus loin, nous avons toujours voulu construire un agent universel utile dans la vie quotidienne. Le projet Astra démontre une compréhension multimodale et des capacités de conversation en temps réel.
Nous avons également fait des progrès dans la génération de vidéos et d'images avec Veo et Imagen 3, et introduit Gemma 2.0, notre prochaine génération de modèles ouverts pour une innovation IA responsable. Vous pouvez en lire plus de Demis Hassabis.
Infrastructure pour l'ère de l'IA : Présentation de Trillium
Entraîner des modèles de pointe nécessite beaucoup de puissance de calcul. La demande pour le calcul ML a augmenté d'un facteur de 1 million au cours des six dernières années, et elle augmente d'un facteur de dix chaque année.
Google a été construit pour cela. Pendant 25 ans, nous avons investi dans une infrastructure technique de classe mondiale, du matériel de pointe qui alimente Search à nos unités de traitement tensoriel personnalisées qui propulsent nos avancées en IA.
Gemini a été entraîné et servi entièrement sur nos TPUs de quatrième et cinquième générations. D'autres entreprises leaders en IA, y compris Anthropic, ont également entraîné leurs modèles sur nos TPUs.
Aujourd'hui, nous sommes ravis d'annoncer notre 6e génération de TPUs, appelée Trillium. Trillium est notre TPU le plus performant et efficace à ce jour, offrant une amélioration de 4,7x en performance de calcul par puce par rapport à la génération précédente, TPU v5e.
Nous rendrons Trillium disponible pour nos clients Cloud fin 2024.
Aux côtés de nos TPUs, nous sommes fiers d'offrir des CPUs et des GPUs pour supporter n'importe quelle charge de travail. Cela inclut les nouveaux processeurs Axion que nous avons annoncés le mois dernier, notre premier CPU basé sur Arm personnalisé qui offre des performances et une efficacité énergétique de pointe dans l'industrie.
Nous sommes également l'un des premiers fournisseurs Cloud à offrir les GPUs Blackwell de pointe de Nvidia, disponibles début 2025. Notre partenariat de longue date avec NVIDIA nous permet d'apporter les capacités révolutionnaires de Blackwell à nos clients.
Les puces sont une partie fondamentale de notre système intégré de bout en bout, du matériel optimisé pour la performance et des logiciels ouverts aux modèles de consommation flexibles. Tout cela converge dans notre AI Hypercomputer, une architecture de superordinateur révolutionnaire.
Les entreprises et les développeurs l'utilisent pour relever des défis plus complexes, avec plus de deux fois l'efficacité par rapport à l'achat de matériel brut et de puces. Nos avancées dans l'AI Hypercomputer sont rendues possibles en partie grâce à notre approche du refroidissement liquide dans nos centres de données.
Nous faisons cela depuis près d'une décennie, bien avant que cela ne devienne la norme pour l'industrie. Aujourd'hui, notre capacité totale de flotte déployée pour les systèmes de refroidissement liquide est proche de 1 gigawatt et en croissance — c'est près de 70 fois la capacité de toute autre flotte.
Sous-jacent à cela se trouve l'échelle pure de notre réseau, qui connecte notre infrastructure à l'échelle mondiale. Notre réseau s'étend sur plus de 2 millions de miles de fibre terrestre et sous-marine : plus de 10 fois la portée du prochain fournisseur cloud leader.
Nous continuerons à faire les investissements nécessaires pour faire avancer l'innovation en IA et fournir des capacités de pointe.
Le chapitre le plus excitant de Search à ce jour
L'un de nos plus grands domaines d'investissement et d'innovation est notre produit fondateur, Search. Il y a 25 ans, nous avons créé Search pour aider les gens à naviguer dans le flot d'informations qui passait en ligne.
À chaque changement de plateforme, nous avons livré des percées pour mieux répondre à vos questions. Sur mobile, nous avons déverrouillé de nouveaux types de questions et de réponses — en utilisant un meilleur contexte, une conscience de la localisation et des informations en temps réel. Avec les avancées dans la compréhension du langage naturel et la vision par ordinateur, nous avons permis de nouvelles façons de chercher, comme utiliser votre voix ou fredonner pour trouver votre nouvelle chanson préférée, ou utiliser une image de cette fleur que vous avez vue lors de votre promenade. Et maintenant, vous pouvez même Cercle pour chercher ces nouvelles chaussures cool que vous pourriez vouloir acheter. Allez-y, vous pouvez toujours les retourner !
Bien sûr, Search dans l'ère Gemini portera cela à un tout autre niveau, combinant nos forces en infrastructure, les dernières capacités d'IA, nos normes élevées pour la qualité de l'information, et nos décennies d'expérience à vous connecter à la richesse du web. Le résultat est un produit qui fait le travail pour vous.
Google Search est l'IA générative à l'échelle de la curiosité humaine. Et c'est notre chapitre le plus excitant de Search à ce jour. En savoir plus sur l'ère Gemini de Search de Liz Reid.
Expériences Gemini plus intelligentes
Gemini est plus qu'un simple chatbot ; il est conçu pour être votre assistant personnel utile qui peut s'attaquer à des tâches complexes et agir en votre nom.
Interagir avec Gemini devrait sembler conversationnel et intuitif. Ainsi, nous annonçons une nouvelle expérience Gemini appelée Live, qui vous permet d'avoir une conversation approfondie avec Gemini en utilisant votre voix. Nous apporterons également 2M de jetons à Gemini Advanced plus tard cette année, rendant possible le téléchargement et l'analyse de fichiers très denses comme des vidéos et du code long. Sissie Hsiao partage plus de détails.
Gemini sur Android
Avec des milliards d'utilisateurs Android dans le monde, nous sommes ravis d'intégrer Gemini plus profondément dans l'expérience utilisateur. En tant que votre nouvel assistant IA, Gemini est là pour vous aider à tout moment, n'importe où. Nous avons incorporé les modèles Gemini dans Android, y compris notre dernier modèle sur appareil : Gemini Nano avec Multimodalité, qui traite le texte, les images, l'audio et la parole pour déverrouiller de nouvelles expériences tout en gardant les informations privées sur votre appareil. Sameer Samat partage les nouvelles Android ici.
Notre approche responsable de l'IA
Nous continuons à aborder l'opportunité de l'IA avec audace, avec un sentiment d'excitation. Nous nous assurons également de le faire de manière responsable. Nous développons une technique de pointe appelée red teaming assisté par IA, qui s'appuie sur les percées de Google DeepMind dans les jeux comme AlphaGo pour améliorer nos modèles. De plus, nous avons étendu SynthID, notre outil de filigrane qui facilite l'identification du contenu généré par IA, à deux nouvelles modalités : le texte et la vidéo. James Manyika partage plus.
Créer l'avenir ensemble
Tout cela montre les progrès importants que nous réalisons en adoptant une approche audacieuse et responsable pour rendre l'IA utile pour tous.
Nous sommes centrés sur l'IA depuis longtemps. Nos décennies de leadership en recherche ont ouvert la voie à de nombreuses percées modernes qui propulsent les progrès de l'IA, pour nous et pour l'industrie. En plus de cela, nous avons :
- Une infrastructure de pointe construite pour l'ère de l'IA
- Une innovation de pointe dans Search, maintenant alimentée par Gemini
- Des produits qui aident à une échelle extraordinaire — y compris 15 produits avec un demi-milliard d'utilisateurs
- Et des plateformes qui permettent à tous — partenaires, clients, créateurs, et vous tous — d'inventer l'avenir.
Ce progrès n'est possible que grâce à notre incroyable communauté de développeurs. Vous le rendez réel, à travers les expériences et les applications que vous construisez chaque jour. Alors, à tous ceux ici à Shoreline et aux millions d'autres qui regardent dans le monde entier, voici aux possibilités à venir et à leur création ensemble.
Recevez plus d'histoires de Google dans votre boîte de réception.
Adresse e-mail Vos informations seront utilisées conformément à la politique de confidentialité de Google.
S'abonner Terminé. Encore une étape.
Vérifiez votre boîte de réception pour confirmer votre abonnement.
Vous êtes déjà abonné à notre newsletter.
Vous pouvez également vous abonner avec une autre adresse e-mail.



Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎




Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎




Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀




Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀




O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀




Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀












