Lar
O mais recente modelo de IA Gemini do Google mostra queda nas pontuações de segurança nos testes
Os testes internos do Google revelam quedas de desempenho preocupantes nos protocolos de segurança de seu modelo de IA mais recente em comparação com as versões anteriores. De acordo com os benchmarks recém-publicados, o modelo Gemini 2.5 Flash demonstra taxas de 4 a 10% mais altas de violações de diretrizes nas principais métricas de segurança ao processar solicitações de texto e imagem.
As avaliações automatizadas do gigante da tecnologia destacam tendências preocupantes: quando apresentado a solicitações de teste de limites, o Gemini 2.5 Flash ultrapassa com mais frequência as linhas de segurança de conteúdo estabelecidas do que seu antecessor Gemini 2.0. A equipe técnica do Google atribui algumas falhas a falsos positivos, mas reconhece o aumento genuíno de resultados que violam as políticas quando o sistema recebe solicitações problemáticas explícitas.
Essa regressão na segurança coincide com uma mudança mais ampla do setor em direção a sistemas de IA mais permissivos. Os principais participantes, incluindo a Meta e a OpenAI, ajustaram recentemente seus modelos para evitar a abstenção de tópicos polêmicos e, em vez disso, tentam dar respostas neutras a assuntos delicados. No entanto, essas mudanças às vezes produzem consequências não intencionais, como foi visto quando o ChatGPT permitiu temporariamente a geração de conteúdo inadequado para menores no início desta semana.
O relatório do Google sugere que o novo modelo se destaca no cumprimento fiel de instruções, inclusive com orientações eticamente questionáveis. Testes independentes confirmam que o Gemini 2.5 Flash demonstra taxas de recusa substancialmente reduzidas ao lidar com tópicos políticos e jurídicos controversos em comparação com as versões anteriores.
Especialistas em segurança de IA expressam preocupação com a divulgação limitada nos relatórios do Google. Sem estudos de caso de violação mais detalhados, os avaliadores externos têm dificuldade para avaliar a gravidade real dessas regressões de segurança. A empresa já foi criticada anteriormente por documentação de segurança atrasada ou incompleta, inclusive com seu principal modelo Gemini 2.5 Pro no início deste ano.
A tensão entre a capacidade irrestrita de seguir instruções e as proteções robustas de conteúdo apresenta desafios contínuos para os desenvolvedores de IA. À medida que os modelos se tornam mais sofisticados na interpretação de solicitações com nuances, a manutenção de limites de resposta apropriados exige uma calibração cuidadosa - um equilíbrio que as métricas mais recentes do Google sugerem que pode estar se perdendo em favor da permissividade.
Artigo relacionado
O Google Fotos dá vida ao icônico guarda-roupa de *Clueless* com IA
O Google Fotos anunciou na quarta-feira um novo recurso baseado em IA que em breve transformará as fotos de suas roupas em um guarda-roupa digital, permitindo que você crie novas combinações de looks
O Google IO 2026 apresenta a interação por voz com a caixa de entrada do Gmail
O Google continua a integrar a IA à sua caixa de entrada. Na conferência de desenvolvedores IO 2026, realizada na terça-feira, a empresa ampliou o recurso “AI Inbox” do Gmail com IA conversacional, pe
O Google lança o Gemini no Chrome na Índia
Na quarta-feira, o Google anunciou que está expandindo a integração do Gemini com o Chrome para novas regiões, incluindo Índia, Canadá e Nova Zelândia. Essa implementação permite que os usuários de co
Recomendações de tópicos especiais relacionados
Comentários (5)
Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.
Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔
Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔
Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!
Os testes internos do Google revelam quedas de desempenho preocupantes nos protocolos de segurança de seu modelo de IA mais recente em comparação com as versões anteriores. De acordo com os benchmarks recém-publicados, o modelo Gemini 2.5 Flash demonstra taxas de 4 a 10% mais altas de violações de diretrizes nas principais métricas de segurança ao processar solicitações de texto e imagem.
As avaliações automatizadas do gigante da tecnologia destacam tendências preocupantes: quando apresentado a solicitações de teste de limites, o Gemini 2.5 Flash ultrapassa com mais frequência as linhas de segurança de conteúdo estabelecidas do que seu antecessor Gemini 2.0. A equipe técnica do Google atribui algumas falhas a falsos positivos, mas reconhece o aumento genuíno de resultados que violam as políticas quando o sistema recebe solicitações problemáticas explícitas.
Essa regressão na segurança coincide com uma mudança mais ampla do setor em direção a sistemas de IA mais permissivos. Os principais participantes, incluindo a Meta e a OpenAI, ajustaram recentemente seus modelos para evitar a abstenção de tópicos polêmicos e, em vez disso, tentam dar respostas neutras a assuntos delicados. No entanto, essas mudanças às vezes produzem consequências não intencionais, como foi visto quando o ChatGPT permitiu temporariamente a geração de conteúdo inadequado para menores no início desta semana.
O relatório do Google sugere que o novo modelo se destaca no cumprimento fiel de instruções, inclusive com orientações eticamente questionáveis. Testes independentes confirmam que o Gemini 2.5 Flash demonstra taxas de recusa substancialmente reduzidas ao lidar com tópicos políticos e jurídicos controversos em comparação com as versões anteriores.
Especialistas em segurança de IA expressam preocupação com a divulgação limitada nos relatórios do Google. Sem estudos de caso de violação mais detalhados, os avaliadores externos têm dificuldade para avaliar a gravidade real dessas regressões de segurança. A empresa já foi criticada anteriormente por documentação de segurança atrasada ou incompleta, inclusive com seu principal modelo Gemini 2.5 Pro no início deste ano.
A tensão entre a capacidade irrestrita de seguir instruções e as proteções robustas de conteúdo apresenta desafios contínuos para os desenvolvedores de IA. À medida que os modelos se tornam mais sofisticados na interpretação de solicitações com nuances, a manutenção de limites de resposta apropriados exige uma calibração cuidadosa - um equilíbrio que as métricas mais recentes do Google sugerem que pode estar se perdendo em favor da permissividade.
O Google Fotos dá vida ao icônico guarda-roupa de *Clueless* com IA
O Google Fotos anunciou na quarta-feira um novo recurso baseado em IA que em breve transformará as fotos de suas roupas em um guarda-roupa digital, permitindo que você crie novas combinações de looks
O Google IO 2026 apresenta a interação por voz com a caixa de entrada do Gmail
O Google continua a integrar a IA à sua caixa de entrada. Na conferência de desenvolvedores IO 2026, realizada na terça-feira, a empresa ampliou o recurso “AI Inbox” do Gmail com IA conversacional, pe
O Google lança o Gemini no Chrome na Índia
Na quarta-feira, o Google anunciou que está expandindo a integração do Gemini com o Chrome para novas regiões, incluindo Índia, Canadá e Nova Zelândia. Essa implementação permite que os usuários de co
Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.
Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔
Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔
Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!











