option
Maison
Nouvelles
Gemma 2 désormais accessible aux chercheurs, aux développeurs

Gemma 2 désormais accessible aux chercheurs, aux développeurs

10 avril 2025
123

Gemma 2 désormais accessible aux chercheurs, aux développeurs

L'IA a le pouvoir de relever certains des défis les plus difficiles auxquels nous sommes confrontés aujourd'hui, mais seulement si tout le monde peut accéder aux outils pour l'utiliser. C'est pourquoi nous avons commencé l'année en introduisant Gemma, un ensemble de modèles ouverts légers et de pointe, conçus à partir de la même technologie qui alimente nos modèles Gemini. Depuis, nous avons élargi la famille Gemma avec CodeGemma, RecurrentGemma et PaliGemma, chacun adapté à différentes tâches d'IA et facilement accessible grâce à des partenariats avec des entreprises comme Hugging Face, NVIDIA et Ollama.

Maintenant, nous sommes ravis d'annoncer la sortie mondiale de Gemma 2 pour les chercheurs et les développeurs. Disponible en tailles de 9 milliards (9B) et 27 milliards (27B) de paramètres, Gemma 2 offre des performances et une efficacité supérieures par rapport à son prédécesseur, avec des améliorations significatives en matière de sécurité. La version 27B est une véritable puissance, rivalisant avec des modèles plus de deux fois plus grands, et elle peut fonctionner sur un seul GPU Tensor Core NVIDIA H100 ou un hôte TPU, réduisant ainsi les coûts de déploiement. C'est plutôt cool que nous ayons rendu les hautes performances accessibles sans se ruiner, non ?

Un nouveau standard pour l'efficacité et la performance dans les modèles ouverts

Nous avons mis beaucoup d'efforts dans la refonte de l'architecture de Gemma 2, visant des performances et une efficacité de premier ordre. Voici ce qui le distingue :

  • Performances exceptionnelles : Avec 27B, Gemma 2 est le leader de sa catégorie, rivalisant même avec des modèles plus de deux fois plus grands. La version 9B brille également, surpassant Llama 3 8B et d'autres modèles ouverts de sa catégorie. Pour tous les détails croustillants, consultez le rapport technique.
  • Efficacité et économies inégalées : Le Gemma 2 27B fonctionne sans problème en pleine précision sur un seul hôte TPU Google Cloud, un GPU Tensor Core NVIDIA A100 80GB ou un GPU Tensor Core NVIDIA H100, ce qui permet de réduire les coûts sans sacrifier les performances. Cela rend les déploiements d'IA plus accessibles et économiques.
  • Inférence ultra-rapide sur divers matériels : Gemma 2 est conçu pour fonctionner rapidement sur tout, des ordinateurs portables de jeu aux ordinateurs de bureau haut de gamme en passant par les configurations cloud. Vous pouvez le tester en pleine précision dans Google AI Studio, l'exécuter localement avec la version quantifiée sur Gemma.cpp sur votre CPU, ou l'essayer sur votre ordinateur personnel avec un NVIDIA RTX ou GeForce RTX via Hugging Face Transformers.

Conçu pour les développeurs et les chercheurs

Gemma 2 n'est pas seulement plus puissant ; il est également conçu pour s'intégrer parfaitement à vos flux de travail :

  • Ouvert et accessible : Comme les modèles Gemma originaux, Gemma 2 est livré avec une licence favorable aux usages commerciaux, permettant aux développeurs et aux chercheurs de partager et de monétiser leurs créations.
  • Large compatibilité avec les frameworks : Vous pouvez facilement intégrer Gemma 2 à vos outils et flux de travail préférés, grâce à sa compatibilité avec les principaux frameworks d'IA comme Hugging Face Transformers, et JAX, PyTorch, et TensorFlow via le natif Keras 3.0, vLLM, Gemma.cpp, Llama.cpp, et Ollama. Il est également optimisé avec NVIDIA TensorRT-LLM pour l'infrastructure accélérée NVIDIA ou en tant que microservice d'inférence NVIDIA NIM, avec une optimisation pour NVIDIA NeMo à venir. Vous pouvez commencer à ajuster aujourd'hui avec Keras et Hugging Face, et nous travaillons sur des options d'ajustement plus efficaces en termes de paramètres.
  • Déploiement sans effort : À partir du mois prochain, les clients Google Cloud pourront facilement déployer et gérer Gemma 2 sur Vertex AI.

Plongez dans le nouveau Gemma Cookbook, rempli d'exemples pratiques et de recettes pour vous aider à construire vos propres applications et à ajuster Gemma 2 pour des tâches spécifiques. Apprenez à utiliser Gemma avec vos outils préférés, y compris pour des tâches comme la génération augmentée par récupération.

Développement responsable de l'IA

Nous nous engageons à aider les développeurs et les chercheurs à construire et déployer l'IA de manière responsable. Notre Responsible Generative AI Toolkit fait partie de cet effort. Le comparateur LLM récemment mis en open-source aide à réaliser des évaluations détaillées des modèles de langage. À partir d'aujourd'hui, vous pouvez utiliser la bibliothèque Python associée pour effectuer des évaluations comparatives avec votre modèle et vos données, et visualiser les résultats dans l'application. Nous travaillons également à la mise en open-source de notre technologie de filigrane textuel, SynthID, pour les modèles Gemma.

Lors de la formation de Gemma 2, nous avons suivi nos processus internes rigoureux de sécurité, en filtrant les données de pré-entraînement et en effectuant des tests et évaluations approfondis contre une large gamme de métriques pour identifier et atténuer les biais et risques potentiels. Nous partageons nos résultats sur les benchmarks publics liés à la sécurité et aux préjudices représentationnels.

Projets construits avec Gemma

Notre premier lancement de Gemma a suscité plus de 10 millions de téléchargements et de nombreux projets incroyables. Par exemple, Navarasa a utilisé Gemma pour développer un modèle célébrant la diversité linguistique de l'Inde.

Avec Gemma 2, les développeurs peuvent entreprendre des projets encore plus ambitieux, repoussant les limites de ce qui est possible en IA. Nous continuerons à explorer de nouvelles architectures et à développer des variantes spécialisées de Gemma pour relever une gamme plus large de tâches et de défis en IA. Nous nous préparons également à lancer un modèle Gemma 2 de 2,6 milliards de paramètres, conçu pour équilibrer une accessibilité légère avec des performances puissantes. Vous pouvez en savoir plus à ce sujet dans le rapport technique.

Pour commencer

Gemma 2 est maintenant disponible dans Google AI Studio, vous pouvez donc tester toutes ses capacités à 27B sans aucune exigence matérielle. Vous pouvez également télécharger les poids du modèle Gemma 2 depuis Kaggle et Hugging Face Models, avec Vertex AI Model Garden à venir bientôt.

Pour soutenir la recherche et le développement, Gemma 2 est disponible gratuitement via Kaggle ou via un niveau gratuit pour les notebooks Colab. Les nouveaux clients Google Cloud peuvent être éligibles à 300 $ de crédits. Les chercheurs académiques peuvent postuler au programme de recherche académique Gemma 2 pour obtenir des crédits Google Cloud afin d'accélérer leurs recherches avec Gemma 2. Les candidatures sont ouvertes jusqu'au 9 août.

Article connexe
Salesforce Dévoile des Coéquipiers Numériques IA dans Slack pour Rivaliser avec Microsoft Copilot Salesforce Dévoile des Coéquipiers Numériques IA dans Slack pour Rivaliser avec Microsoft Copilot Le nouvel outil, Agentforce dans Slack, permet aux entreprises de créer et de déployer des agents IA spécifiques à des tâches qui recherchent dans les discussions professionnelles, accèdent aux donnée
Investissement de 40 milliards de dollars d'Oracle dans les puces Nvidia pour renforcer le centre de données IA au Texas Investissement de 40 milliards de dollars d'Oracle dans les puces Nvidia pour renforcer le centre de données IA au Texas Oracle prévoit d'investir environ 40 milliards de dollars dans des puces Nvidia pour alimenter un nouveau centre de données majeur au Texas, développé par OpenAI, selon le Financial Times. Cette trans
Application Meta AI pour introduire un niveau premium et des publicités Application Meta AI pour introduire un niveau premium et des publicités L'application d'IA de Meta pourrait bientôt proposer un abonnement payant, à l'image des offres de concurrents comme OpenAI, Google et Microsoft. Lors d'une conférence sur les résultats du premier tri
commentaires (61)
0/200
JuanMoore
JuanMoore 28 juillet 2025 03:20:54 UTC+02:00

Wow, Gemma 2 sounds like a game-changer for researchers! Open models like this could spark some wild innovations. Anyone else excited to see what devs cook up with this? 🚀

AndrewGarcía
AndrewGarcía 20 avril 2025 19:42:54 UTC+02:00

Gemma 2 é uma revolução para pesquisadores! É tão acessível e fácil de usar. O único ponto negativo é a curva de aprendizado para iniciantes. Mas, uma vez que você pega o jeito, é incrível! 🚀

TimothyMitchell
TimothyMitchell 20 avril 2025 17:50:33 UTC+02:00

研究者にとってGemma 2は革命的です!アクセスしやすく、使いやすいです。ただ、初心者にとっては学習曲線が高いです。慣れれば素晴らしいツールです!🚀

BillyWilson
BillyWilson 16 avril 2025 06:44:50 UTC+02:00

Gemma 2는 연구자들에게 혁신적이에요! 접근성이 좋고 사용하기 쉬워요. 다만, 초보자에게는 학습 곡선이 높아요. 익숙해지면 정말 대단해요! 🚀

StevenGonzalez
StevenGonzalez 16 avril 2025 06:31:23 UTC+02:00

Gemma 2는 연구자와 개발자에게 혁신적인 도구입니다! 시작하기 쉬워서 좋고, 모델도 최첨단이에요. 다만 문서가 조금 더 자세했으면 좋겠어요. 그래도 AI에 도전하고 싶은 분들에게 강력 추천합니다! 🚀

IsabellaLevis
IsabellaLevis 16 avril 2025 04:47:37 UTC+02:00

Gemma 2は研究者や開発者にとって革命的なツールです!使い始めるのも簡単で、モデルも最先端です。ただ、ドキュメントがもう少し詳しければ完璧だったのに。でも、AIに挑戦したい人には強くおすすめします!🚀

Retour en haut
OR