Hogar
El último modelo de inteligencia artificial Gemini de Google muestra un descenso en las puntuaciones de seguridad en las pruebas
Las pruebas internas de Google revelan preocupantes caídas de rendimiento en los protocolos de seguridad de su último modelo de IA en comparación con versiones anteriores. Según las pruebas comparativas publicadas recientemente, el modelo Gemini 2.5 Flash presenta entre un 4 y un 10% más de infracciones de las directrices en las principales métricas de seguridad al procesar tanto mensajes de texto como de imagen.
Las evaluaciones automatizadas del gigante tecnológico ponen de manifiesto tendencias preocupantes: cuando se le presentan solicitudes de prueba de límites, Gemini 2.5 Flash cruza con más frecuencia las líneas de seguridad de contenido establecidas que su predecesor Gemini 2.0. El equipo técnico de Google atribuye algunos fallos a falsos positivos, pero reconoce un aumento real de los resultados que violan las políticas cuando el sistema recibe solicitudes explícitamente problemáticas.
Esta regresión de la seguridad coincide con un cambio más amplio de la industria hacia sistemas de IA más permisivos. Algunos de los principales actores, como Meta y OpenAI, han ajustado recientemente sus modelos para evitar abstenerse en temas controvertidos y, en su lugar, intentar dar respuestas neutrales a temas delicados. Sin embargo, estos cambios a veces producen consecuencias no deseadas, como se vio cuando ChatGPT permitió temporalmente la generación de contenidos inapropiados para menores a principios de esta semana.
El informe de Google sugiere que el nuevo modelo destaca en el seguimiento fiel de instrucciones, incluso con indicaciones éticamente cuestionables. Pruebas independientes confirman que Gemini 2.5 Flash demuestra tasas de rechazo sustancialmente reducidas al tratar temas políticos y legales controvertidos en comparación con las versiones anteriores.
Los expertos en seguridad de la IA expresan su preocupación por la limitada divulgación en los informes de Google. Sin estudios de casos de infracción más detallados, los evaluadores externos tienen dificultades para valorar la gravedad en el mundo real de estas regresiones de seguridad. La empresa ya se ha enfrentado a críticas por documentación de seguridad retrasada o incompleta, incluso con su modelo estrella Gemini 2.5 Pro a principios de este año.
La tensión entre la capacidad de seguir instrucciones sin restricciones y las sólidas salvaguardias de contenido plantea retos constantes a los desarrolladores de IA. A medida que los modelos se vuelven más sofisticados a la hora de interpretar peticiones matizadas, mantener unos límites de respuesta adecuados requiere una calibración cuidadosa, un equilibrio que, según las últimas métricas de Google, puede estar decayendo a favor de la permisividad.
Artículo relacionado
Google Fotos da vida al emblemático armario de «Clueless» gracias a la inteligencia artificial
Google Fotos anunció el miércoles una nueva función basada en la inteligencia artificial que pronto convertirá las fotos de tu ropa en un armario digital, lo que te permitirá crear nuevas combinacione
Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail
Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de
Recomendaciones de temas especiales relacionados
comentario (5)
0/500
Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.
Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔
Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔
Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!
Las pruebas internas de Google revelan preocupantes caídas de rendimiento en los protocolos de seguridad de su último modelo de IA en comparación con versiones anteriores. Según las pruebas comparativas publicadas recientemente, el modelo Gemini 2.5 Flash presenta entre un 4 y un 10% más de infracciones de las directrices en las principales métricas de seguridad al procesar tanto mensajes de texto como de imagen.
Las evaluaciones automatizadas del gigante tecnológico ponen de manifiesto tendencias preocupantes: cuando se le presentan solicitudes de prueba de límites, Gemini 2.5 Flash cruza con más frecuencia las líneas de seguridad de contenido establecidas que su predecesor Gemini 2.0. El equipo técnico de Google atribuye algunos fallos a falsos positivos, pero reconoce un aumento real de los resultados que violan las políticas cuando el sistema recibe solicitudes explícitamente problemáticas.
Esta regresión de la seguridad coincide con un cambio más amplio de la industria hacia sistemas de IA más permisivos. Algunos de los principales actores, como Meta y OpenAI, han ajustado recientemente sus modelos para evitar abstenerse en temas controvertidos y, en su lugar, intentar dar respuestas neutrales a temas delicados. Sin embargo, estos cambios a veces producen consecuencias no deseadas, como se vio cuando ChatGPT permitió temporalmente la generación de contenidos inapropiados para menores a principios de esta semana.
El informe de Google sugiere que el nuevo modelo destaca en el seguimiento fiel de instrucciones, incluso con indicaciones éticamente cuestionables. Pruebas independientes confirman que Gemini 2.5 Flash demuestra tasas de rechazo sustancialmente reducidas al tratar temas políticos y legales controvertidos en comparación con las versiones anteriores.
Los expertos en seguridad de la IA expresan su preocupación por la limitada divulgación en los informes de Google. Sin estudios de casos de infracción más detallados, los evaluadores externos tienen dificultades para valorar la gravedad en el mundo real de estas regresiones de seguridad. La empresa ya se ha enfrentado a críticas por documentación de seguridad retrasada o incompleta, incluso con su modelo estrella Gemini 2.5 Pro a principios de este año.
La tensión entre la capacidad de seguir instrucciones sin restricciones y las sólidas salvaguardias de contenido plantea retos constantes a los desarrolladores de IA. A medida que los modelos se vuelven más sofisticados a la hora de interpretar peticiones matizadas, mantener unos límites de respuesta adecuados requiere una calibración cuidadosa, un equilibrio que, según las últimas métricas de Google, puede estar decayendo a favor de la permisividad.
Google Fotos da vida al emblemático armario de «Clueless» gracias a la inteligencia artificial
Google Fotos anunció el miércoles una nueva función basada en la inteligencia artificial que pronto convertirá las fotos de tu ropa en un armario digital, lo que te permitirá crear nuevas combinacione
Google IO 2026 presenta la interacción por voz con la bandeja de entrada de Gmail
Google sigue integrando la IA en tu bandeja de entrada. En la conferencia de desarrolladores IO 2026 celebrada el martes, la empresa amplió su función «Bandeja de entrada con IA» de Gmail con IA conve
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de
Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.
Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔
Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔
Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!











