opção
Lar
Notícias
Gemma 2 agora acessível a pesquisadores, desenvolvedores

Gemma 2 agora acessível a pesquisadores, desenvolvedores

10 de Abril de 2025
123

Gemma 2 agora acessível a pesquisadores, desenvolvedores

A IA tem o poder de enfrentar alguns dos desafios mais difíceis que enfrentamos hoje — mas isso só acontece se todos puderem ter acesso às ferramentas para usá-la. Por isso, começamos o ano apresentando o Gemma, um conjunto de modelos abertos, leves e de ponta, criados com a mesma tecnologia que impulsiona nossos modelos Gemini. Desde então, expandimos a família Gemma com CodeGemma, RecurrentGemma e PaliGemma, cada um adaptado para diferentes tarefas de IA e facilmente acessível por meio de parcerias com empresas como Hugging Face, NVIDIA e Ollama.

Agora, estamos entusiasmados em anunciar o lançamento global do Gemma 2 para pesquisadores e desenvolvedores. Disponível em tamanhos de 9 bilhões (9B) e 27 bilhões (27B) de parâmetros, o Gemma 2 oferece desempenho e eficiência superiores em comparação com seu antecessor, com melhorias significativas em segurança. A versão 27B é uma potência, competindo com modelos mais que o dobro de seu tamanho, e pode ser executada em uma única GPU NVIDIA H100 Tensor Core ou host TPU, reduzindo custos de implantação. É bem legal como tornamos o alto desempenho acessível sem quebrar o banco, né?

Um novo padrão de eficiência e desempenho em modelos abertos

Colocamos muito esforço na reformulação da arquitetura do Gemma 2, buscando desempenho e eficiência de alto nível. Veja o que o diferencia:

  • Desempenho excepcional: Com 27B, o Gemma 2 é o líder em sua classe, competindo até com modelos mais que o dobro de seu tamanho. A versão 9B também brilha, superando o Llama 3 8B e outros modelos abertos em sua categoria. Para todos os detalhes suculentos, confira o relatório técnico.
  • Eficiência e economia de custos incomparáveis: O Gemma 2 de 27B funciona perfeitamente em precisão total em um único host TPU do Google Cloud, GPU NVIDIA A100 80GB Tensor Core ou GPU NVIDIA H100 Tensor Core, o que significa que você pode manter os custos baixos sem sacrificar o desempenho. Isso torna as implantações de IA mais acessíveis e econômicas.
  • Inferência extremamente rápida em diferentes hardwares: O Gemma 2 é projetado para rodar rapidamente em tudo, desde laptops para jogos e desktops de ponta até configurações em nuvem. Você pode testá-lo em precisão total no Google AI Studio, executá-lo localmente com a versão quantizada no Gemma.cpp em sua CPU ou experimentá-lo em seu computador doméstico com uma NVIDIA RTX ou GeForce RTX por meio do Hugging Face Transformers.

Gráfico mostrando benchmarks de desempenho do Gemma

Construído para desenvolvedores e pesquisadores

O Gemma 2 não é apenas mais poderoso; também foi projetado para se integrar perfeitamente aos seus fluxos de trabalho:

  • Aberto e acessível: Como os modelos Gemma originais, o Gemma 2 vem com uma licença amigável para uso comercial, permitindo que desenvolvedores e pesquisadores compartilhem e monetizem suas criações.
  • Ampla compatibilidade com frameworks: Você pode integrar facilmente o Gemma 2 com suas ferramentas e fluxos de trabalho favoritos, graças à compatibilidade com os principais frameworks de IA como Hugging Face Transformers, e JAX, PyTorch e TensorFlow via Keras 3.0 nativo, vLLM, Gemma.cpp, Llama.cpp e Ollama. Ele também é otimizado com NVIDIA TensorRT-LLM para infraestrutura acelerada por NVIDIA ou como um microsserviço de inferência NVIDIA NIM, com otimização para o NVIDIA NeMo no horizonte. Você pode começar a fazer ajustes finos hoje com Keras e Hugging Face, e estamos trabalhando em opções de ajuste fino mais eficientes em parâmetros.
  • Implantação sem esforço: A partir do próximo mês, os clientes do Google Cloud poderão implantar e gerenciar o Gemma 2 facilmente no Vertex AI.

Mergulhe no novo Gemma Cookbook, repleto de exemplos práticos e receitas para ajudá-lo a construir suas próprias aplicações e ajustar o Gemma 2 para tarefas específicas. Aprenda como usar o Gemma com suas ferramentas preferidas, incluindo para tarefas como geração aumentada por recuperação.

Desenvolvimento responsável de IA

Estamos comprometidos em ajudar desenvolvedores e pesquisadores a construir e implantar IA de forma responsável. Nosso Kit de Ferramentas de IA Generativa Responsável faz parte desse esforço. O LLM Comparator, recentemente tornado de código aberto, ajuda com avaliações detalhadas de modelos de linguagem. A partir de hoje, você pode usar a biblioteca Python complementar para executar avaliações comparativas com seu modelo e dados, e visualizar os resultados no aplicativo. Também estamos trabalhando na abertura do código da nossa tecnologia de marca d'água de texto, SynthID, para modelos Gemma.

Ao treinar o Gemma 2, seguimos nossos rigorosos processos internos de segurança, filtrando dados de pré-treinamento e realizando testes e avaliações minuciosas contra uma ampla gama de métricas para identificar e mitigar possíveis vieses e riscos. Compartilhamos nossos resultados em benchmarks públicos relacionados à segurança e danos representacionais.

Gráfico mostrando avaliações de segurança do Gemma

Projetos construídos com Gemma

Nosso primeiro lançamento do Gemma gerou mais de 10 milhões de downloads e muitos projetos incríveis. Por exemplo, o Navarasa usou o Gemma para desenvolver um modelo que celebra a diversidade linguística da Índia.

Com o Gemma 2, os desenvolvedores podem enfrentar projetos ainda mais ambiciosos, expandindo os limites do que é possível em IA. Continuaremos explorando novas arquiteturas e desenvolvendo variantes especializadas do Gemma para enfrentar uma gama mais ampla de tarefas e desafios de IA. Também estamos nos preparando para lançar um modelo Gemma 2 de 2,6 bilhões de parâmetros, projetado para equilibrar acessibilidade leve com desempenho poderoso. Você pode saber mais sobre isso no relatório técnico.

Primeiros passos

O Gemma 2 está agora disponível no Google AI Studio, para que você possa testar todas as suas capacidades em 27B sem requisitos de hardware. Você também pode baixar os pesos do modelo Gemma 2 no Kaggle e Hugging Face Models, com o Vertex AI Model Garden em breve.

Para apoiar pesquisa e desenvolvimento, o Gemma 2 está disponível gratuitamente no Kaggle ou por meio de uma camada gratuita para notebooks Colab. Clientes do Google Cloud pela primeira vez podem ser elegíveis para $300 em créditos. Pesquisadores acadêmicos podem se inscrever no Programa de Pesquisa Acadêmica do Gemma 2 para obter créditos do Google Cloud e acelerar suas pesquisas com o Gemma 2. As inscrições estão abertas até 9 de agosto.

Artigo relacionado
Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot Salesforce Apresenta Companheiros Digitais de IA no Slack para Rivalizar com o Microsoft Copilot A Salesforce lançou uma nova estratégia de IA para o local de trabalho, introduzindo “companheiros digitais” especializados integrados às conversas do Slack, revelou a empresa na segunda-feira.A nova
Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas Investimento de US$ 40 bilhões da Oracle em chips Nvidia impulsiona centro de dados de IA no Texas A Oracle planeja investir aproximadamente US$ 40 bilhões em chips Nvidia para alimentar um grande novo centro de dados no Texas, desenvolvido pela OpenAI, conforme relatado pelo Financial Times. Este
Aplicativo Meta AI Introduzirá Nível Premium e Anúncios Aplicativo Meta AI Introduzirá Nível Premium e Anúncios O aplicativo de IA da Meta pode em breve apresentar uma assinatura paga, seguindo o exemplo de concorrentes como OpenAI, Google e Microsoft. Durante uma teleconferência de resultados do primeiro trime
Comentários (61)
0/200
JuanMoore
JuanMoore 28 de Julho de 2025 à54 02:20:54 WEST

Wow, Gemma 2 sounds like a game-changer for researchers! Open models like this could spark some wild innovations. Anyone else excited to see what devs cook up with this? 🚀

AndrewGarcía
AndrewGarcía 20 de Abril de 2025 à54 18:42:54 WEST

Gemma 2 é uma revolução para pesquisadores! É tão acessível e fácil de usar. O único ponto negativo é a curva de aprendizado para iniciantes. Mas, uma vez que você pega o jeito, é incrível! 🚀

TimothyMitchell
TimothyMitchell 20 de Abril de 2025 à33 16:50:33 WEST

研究者にとってGemma 2は革命的です!アクセスしやすく、使いやすいです。ただ、初心者にとっては学習曲線が高いです。慣れれば素晴らしいツールです!🚀

BillyWilson
BillyWilson 16 de Abril de 2025 à50 05:44:50 WEST

Gemma 2는 연구자들에게 혁신적이에요! 접근성이 좋고 사용하기 쉬워요. 다만, 초보자에게는 학습 곡선이 높아요. 익숙해지면 정말 대단해요! 🚀

StevenGonzalez
StevenGonzalez 16 de Abril de 2025 à23 05:31:23 WEST

Gemma 2는 연구자와 개발자에게 혁신적인 도구입니다! 시작하기 쉬워서 좋고, 모델도 최첨단이에요. 다만 문서가 조금 더 자세했으면 좋겠어요. 그래도 AI에 도전하고 싶은 분들에게 강력 추천합니다! 🚀

IsabellaLevis
IsabellaLevis 16 de Abril de 2025 à37 03:47:37 WEST

Gemma 2は研究者や開発者にとって革命的なツールです!使い始めるのも簡単で、モデルも最先端です。ただ、ドキュメントがもう少し詳しければ完璧だったのに。でも、AIに挑戦したい人には強くおすすめします!🚀

De volta ao topo
OR