Gemma 2 agora acessível a pesquisadores, desenvolvedores

A IA tem o poder de enfrentar alguns dos desafios mais difíceis que enfrentamos hoje — mas isso só acontece se todos puderem ter acesso às ferramentas para usá-la. Por isso, começamos o ano apresentando o Gemma, um conjunto de modelos abertos, leves e de ponta, criados com a mesma tecnologia que impulsiona nossos modelos Gemini. Desde então, expandimos a família Gemma com CodeGemma, RecurrentGemma e PaliGemma, cada um adaptado para diferentes tarefas de IA e facilmente acessível por meio de parcerias com empresas como Hugging Face, NVIDIA e Ollama.
Agora, estamos entusiasmados em anunciar o lançamento global do Gemma 2 para pesquisadores e desenvolvedores. Disponível em tamanhos de 9 bilhões (9B) e 27 bilhões (27B) de parâmetros, o Gemma 2 oferece desempenho e eficiência superiores em comparação com seu antecessor, com melhorias significativas em segurança. A versão 27B é uma potência, competindo com modelos mais que o dobro de seu tamanho, e pode ser executada em uma única GPU NVIDIA H100 Tensor Core ou host TPU, reduzindo custos de implantação. É bem legal como tornamos o alto desempenho acessível sem quebrar o banco, né?
Um novo padrão de eficiência e desempenho em modelos abertos
Colocamos muito esforço na reformulação da arquitetura do Gemma 2, buscando desempenho e eficiência de alto nível. Veja o que o diferencia:
- Desempenho excepcional: Com 27B, o Gemma 2 é o líder em sua classe, competindo até com modelos mais que o dobro de seu tamanho. A versão 9B também brilha, superando o Llama 3 8B e outros modelos abertos em sua categoria. Para todos os detalhes suculentos, confira o relatório técnico.
- Eficiência e economia de custos incomparáveis: O Gemma 2 de 27B funciona perfeitamente em precisão total em um único host TPU do Google Cloud, GPU NVIDIA A100 80GB Tensor Core ou GPU NVIDIA H100 Tensor Core, o que significa que você pode manter os custos baixos sem sacrificar o desempenho. Isso torna as implantações de IA mais acessíveis e econômicas.
- Inferência extremamente rápida em diferentes hardwares: O Gemma 2 é projetado para rodar rapidamente em tudo, desde laptops para jogos e desktops de ponta até configurações em nuvem. Você pode testá-lo em precisão total no Google AI Studio, executá-lo localmente com a versão quantizada no Gemma.cpp em sua CPU ou experimentá-lo em seu computador doméstico com uma NVIDIA RTX ou GeForce RTX por meio do Hugging Face Transformers.
![Gráfico mostrando benchmarks de desempenho do Gemma]()
Construído para desenvolvedores e pesquisadores
O Gemma 2 não é apenas mais poderoso; também foi projetado para se integrar perfeitamente aos seus fluxos de trabalho:
- Aberto e acessível: Como os modelos Gemma originais, o Gemma 2 vem com uma licença amigável para uso comercial, permitindo que desenvolvedores e pesquisadores compartilhem e monetizem suas criações.
- Ampla compatibilidade com frameworks: Você pode integrar facilmente o Gemma 2 com suas ferramentas e fluxos de trabalho favoritos, graças à compatibilidade com os principais frameworks de IA como Hugging Face Transformers, e JAX, PyTorch e TensorFlow via Keras 3.0 nativo, vLLM, Gemma.cpp, Llama.cpp e Ollama. Ele também é otimizado com NVIDIA TensorRT-LLM para infraestrutura acelerada por NVIDIA ou como um microsserviço de inferência NVIDIA NIM, com otimização para o NVIDIA NeMo no horizonte. Você pode começar a fazer ajustes finos hoje com Keras e Hugging Face, e estamos trabalhando em opções de ajuste fino mais eficientes em parâmetros.
- Implantação sem esforço: A partir do próximo mês, os clientes do Google Cloud poderão implantar e gerenciar o Gemma 2 facilmente no Vertex AI.
Mergulhe no novo Gemma Cookbook, repleto de exemplos práticos e receitas para ajudá-lo a construir suas próprias aplicações e ajustar o Gemma 2 para tarefas específicas. Aprenda como usar o Gemma com suas ferramentas preferidas, incluindo para tarefas como geração aumentada por recuperação.
Desenvolvimento responsável de IA
Estamos comprometidos em ajudar desenvolvedores e pesquisadores a construir e implantar IA de forma responsável. Nosso Kit de Ferramentas de IA Generativa Responsável faz parte desse esforço. O LLM Comparator, recentemente tornado de código aberto, ajuda com avaliações detalhadas de modelos de linguagem. A partir de hoje, você pode usar a biblioteca Python complementar para executar avaliações comparativas com seu modelo e dados, e visualizar os resultados no aplicativo. Também estamos trabalhando na abertura do código da nossa tecnologia de marca d'água de texto, SynthID, para modelos Gemma.
Ao treinar o Gemma 2, seguimos nossos rigorosos processos internos de segurança, filtrando dados de pré-treinamento e realizando testes e avaliações minuciosas contra uma ampla gama de métricas para identificar e mitigar possíveis vieses e riscos. Compartilhamos nossos resultados em benchmarks públicos relacionados à segurança e danos representacionais.
![Gráfico mostrando avaliações de segurança do Gemma]()
Projetos construídos com Gemma
Nosso primeiro lançamento do Gemma gerou mais de 10 milhões de downloads e muitos projetos incríveis. Por exemplo, o Navarasa usou o Gemma para desenvolver um modelo que celebra a diversidade linguística da Índia.
Com o Gemma 2, os desenvolvedores podem enfrentar projetos ainda mais ambiciosos, expandindo os limites do que é possível em IA. Continuaremos explorando novas arquiteturas e desenvolvendo variantes especializadas do Gemma para enfrentar uma gama mais ampla de tarefas e desafios de IA. Também estamos nos preparando para lançar um modelo Gemma 2 de 2,6 bilhões de parâmetros, projetado para equilibrar acessibilidade leve com desempenho poderoso. Você pode saber mais sobre isso no relatório técnico.
Primeiros passos
O Gemma 2 está agora disponível no Google AI Studio, para que você possa testar todas as suas capacidades em 27B sem requisitos de hardware. Você também pode baixar os pesos do modelo Gemma 2 no Kaggle e Hugging Face Models, com o Vertex AI Model Garden em breve.
Para apoiar pesquisa e desenvolvimento, o Gemma 2 está disponível gratuitamente no Kaggle ou por meio de uma camada gratuita para notebooks Colab. Clientes do Google Cloud pela primeira vez podem ser elegíveis para $300 em créditos. Pesquisadores acadêmicos podem se inscrever no Programa de Pesquisa Acadêmica do Gemma 2 para obter créditos do Google Cloud e acelerar suas pesquisas com o Gemma 2. As inscrições estão abertas até 9 de agosto.
Artigo relacionado
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física
A Kakao Mobility planeja desenvolver tecnologias de direção autônoma de nível 4 internamente, como parte de sua estratégia de IA física.Na conferência World IT Show 2026, realizada no COEX, em Seul,
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
Recomendações de tópicos especiais relacionados
Comentários (64)
As a student working on my first NLP project, having access to lightweight open models like Gemma 2 feels like a game-changer! 🙌 Finally something that won't require supercomputing resources. Curious if the training datasets will be equally accessible though? Still, excited to experiment with this! 🤖
Gemma 2가 개발자들에게 공개되었다니 기대되네요! 경량 모델이라서 스타트업이나 개인 개발자도 활용하기 좋을 것 같아요. 근데 진짜 빨리 써보고 싶은데 한국어 지원은 언제될까요? ㄷㄷ
Wow, Gemma 2 sounds like a game-changer for researchers! Open models like this could spark some wild innovations. Anyone else excited to see what devs cook up with this? 🚀
Gemma 2 é uma revolução para pesquisadores! É tão acessível e fácil de usar. O único ponto negativo é a curva de aprendizado para iniciantes. Mas, uma vez que você pega o jeito, é incrível! 🚀

A IA tem o poder de enfrentar alguns dos desafios mais difíceis que enfrentamos hoje — mas isso só acontece se todos puderem ter acesso às ferramentas para usá-la. Por isso, começamos o ano apresentando o Gemma, um conjunto de modelos abertos, leves e de ponta, criados com a mesma tecnologia que impulsiona nossos modelos Gemini. Desde então, expandimos a família Gemma com CodeGemma, RecurrentGemma e PaliGemma, cada um adaptado para diferentes tarefas de IA e facilmente acessível por meio de parcerias com empresas como Hugging Face, NVIDIA e Ollama.
Agora, estamos entusiasmados em anunciar o lançamento global do Gemma 2 para pesquisadores e desenvolvedores. Disponível em tamanhos de 9 bilhões (9B) e 27 bilhões (27B) de parâmetros, o Gemma 2 oferece desempenho e eficiência superiores em comparação com seu antecessor, com melhorias significativas em segurança. A versão 27B é uma potência, competindo com modelos mais que o dobro de seu tamanho, e pode ser executada em uma única GPU NVIDIA H100 Tensor Core ou host TPU, reduzindo custos de implantação. É bem legal como tornamos o alto desempenho acessível sem quebrar o banco, né?
Um novo padrão de eficiência e desempenho em modelos abertos
Colocamos muito esforço na reformulação da arquitetura do Gemma 2, buscando desempenho e eficiência de alto nível. Veja o que o diferencia:
- Desempenho excepcional: Com 27B, o Gemma 2 é o líder em sua classe, competindo até com modelos mais que o dobro de seu tamanho. A versão 9B também brilha, superando o Llama 3 8B e outros modelos abertos em sua categoria. Para todos os detalhes suculentos, confira o relatório técnico.
- Eficiência e economia de custos incomparáveis: O Gemma 2 de 27B funciona perfeitamente em precisão total em um único host TPU do Google Cloud, GPU NVIDIA A100 80GB Tensor Core ou GPU NVIDIA H100 Tensor Core, o que significa que você pode manter os custos baixos sem sacrificar o desempenho. Isso torna as implantações de IA mais acessíveis e econômicas.
- Inferência extremamente rápida em diferentes hardwares: O Gemma 2 é projetado para rodar rapidamente em tudo, desde laptops para jogos e desktops de ponta até configurações em nuvem. Você pode testá-lo em precisão total no Google AI Studio, executá-lo localmente com a versão quantizada no Gemma.cpp em sua CPU ou experimentá-lo em seu computador doméstico com uma NVIDIA RTX ou GeForce RTX por meio do Hugging Face Transformers.
Construído para desenvolvedores e pesquisadores
O Gemma 2 não é apenas mais poderoso; também foi projetado para se integrar perfeitamente aos seus fluxos de trabalho:
- Aberto e acessível: Como os modelos Gemma originais, o Gemma 2 vem com uma licença amigável para uso comercial, permitindo que desenvolvedores e pesquisadores compartilhem e monetizem suas criações.
- Ampla compatibilidade com frameworks: Você pode integrar facilmente o Gemma 2 com suas ferramentas e fluxos de trabalho favoritos, graças à compatibilidade com os principais frameworks de IA como Hugging Face Transformers, e JAX, PyTorch e TensorFlow via Keras 3.0 nativo, vLLM, Gemma.cpp, Llama.cpp e Ollama. Ele também é otimizado com NVIDIA TensorRT-LLM para infraestrutura acelerada por NVIDIA ou como um microsserviço de inferência NVIDIA NIM, com otimização para o NVIDIA NeMo no horizonte. Você pode começar a fazer ajustes finos hoje com Keras e Hugging Face, e estamos trabalhando em opções de ajuste fino mais eficientes em parâmetros.
- Implantação sem esforço: A partir do próximo mês, os clientes do Google Cloud poderão implantar e gerenciar o Gemma 2 facilmente no Vertex AI.
Mergulhe no novo Gemma Cookbook, repleto de exemplos práticos e receitas para ajudá-lo a construir suas próprias aplicações e ajustar o Gemma 2 para tarefas específicas. Aprenda como usar o Gemma com suas ferramentas preferidas, incluindo para tarefas como geração aumentada por recuperação.
Desenvolvimento responsável de IA
Estamos comprometidos em ajudar desenvolvedores e pesquisadores a construir e implantar IA de forma responsável. Nosso Kit de Ferramentas de IA Generativa Responsável faz parte desse esforço. O LLM Comparator, recentemente tornado de código aberto, ajuda com avaliações detalhadas de modelos de linguagem. A partir de hoje, você pode usar a biblioteca Python complementar para executar avaliações comparativas com seu modelo e dados, e visualizar os resultados no aplicativo. Também estamos trabalhando na abertura do código da nossa tecnologia de marca d'água de texto, SynthID, para modelos Gemma.
Ao treinar o Gemma 2, seguimos nossos rigorosos processos internos de segurança, filtrando dados de pré-treinamento e realizando testes e avaliações minuciosas contra uma ampla gama de métricas para identificar e mitigar possíveis vieses e riscos. Compartilhamos nossos resultados em benchmarks públicos relacionados à segurança e danos representacionais.
Projetos construídos com Gemma
Nosso primeiro lançamento do Gemma gerou mais de 10 milhões de downloads e muitos projetos incríveis. Por exemplo, o Navarasa usou o Gemma para desenvolver um modelo que celebra a diversidade linguística da Índia.
Com o Gemma 2, os desenvolvedores podem enfrentar projetos ainda mais ambiciosos, expandindo os limites do que é possível em IA. Continuaremos explorando novas arquiteturas e desenvolvendo variantes especializadas do Gemma para enfrentar uma gama mais ampla de tarefas e desafios de IA. Também estamos nos preparando para lançar um modelo Gemma 2 de 2,6 bilhões de parâmetros, projetado para equilibrar acessibilidade leve com desempenho poderoso. Você pode saber mais sobre isso no relatório técnico.
Primeiros passos
O Gemma 2 está agora disponível no Google AI Studio, para que você possa testar todas as suas capacidades em 27B sem requisitos de hardware. Você também pode baixar os pesos do modelo Gemma 2 no Kaggle e Hugging Face Models, com o Vertex AI Model Garden em breve.
Para apoiar pesquisa e desenvolvimento, o Gemma 2 está disponível gratuitamente no Kaggle ou por meio de uma camada gratuita para notebooks Colab. Clientes do Google Cloud pela primeira vez podem ser elegíveis para $300 em créditos. Pesquisadores acadêmicos podem se inscrever no Programa de Pesquisa Acadêmica do Gemma 2 para obter créditos do Google Cloud e acelerar suas pesquisas com o Gemma 2. As inscrições estão abertas até 9 de agosto.
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
As a student working on my first NLP project, having access to lightweight open models like Gemma 2 feels like a game-changer! 🙌 Finally something that won't require supercomputing resources. Curious if the training datasets will be equally accessible though? Still, excited to experiment with this! 🤖
Gemma 2가 개발자들에게 공개되었다니 기대되네요! 경량 모델이라서 스타트업이나 개인 개발자도 활용하기 좋을 것 같아요. 근데 진짜 빨리 써보고 싶은데 한국어 지원은 언제될까요? ㄷㄷ
Wow, Gemma 2 sounds like a game-changer for researchers! Open models like this could spark some wild innovations. Anyone else excited to see what devs cook up with this? 🚀
Gemma 2 é uma revolução para pesquisadores! É tão acessível e fácil de usar. O único ponto negativo é a curva de aprendizado para iniciantes. Mas, uma vez que você pega o jeito, é incrível! 🚀





Lar






