구글의 최신 제미니 AI 모델은 테스트에서 안전 점수가 하락하고 있습니다.
Google의 내부 테스트 결과 최신 AI 모델의 안전 프로토콜이 이전 버전에 비해 성능이 저하된 것으로 나타났습니다. 새로 발표된 벤치마크에 따르면 Gemini 2.5 플래시 모델은 텍스트와 이미지 프롬프트를 모두 처리할 때 주요 안전 지표에서 가이드라인 위반 비율이 4~10% 더 높은 것으로 나타났습니다.
이 기술 대기업의 자동화된 평가는 우려스러운 경향을 보여줍니다. 경계 테스트 프롬프트가 표시될 때 Gemini 2.5 Flash는 이전 버전인 Gemini 2.0보다 콘텐츠 안전 선을 더 자주 넘었습니다. Google의 기술팀은 일부 실패의 원인을 오탐으로 보고 있지만, 시스템이 명시적으로 문제가 있는 요청을 수신할 때 정책을 위반하는 출력의 실제 증가를 인정하고 있습니다.
이러한 안전성의 퇴보는 보다 허용적인 AI 시스템으로의 광범위한 업계 변화와 맞물려 있습니다. Meta와 OpenAI를 비롯한 주요 업체들은 최근 논란이 되는 주제에 대해 기권하는 대신 민감한 주제에 중립적인 대응을 시도하도록 모델을 조정하고 있습니다. 하지만 이러한 변화는 때때로 의도하지 않은 결과를 낳기도 하는데, 이번 주 초에 ChatGPT가 미성년자를 위한 부적절한 콘텐츠 생성을 일시적으로 허용한 사례에서 볼 수 있듯이 말입니다.
Google의 보고서에 따르면 새 모델은 윤리적으로 의심스러운 지시를 포함하여 지침을 충실히 따르는 데 탁월하다고 합니다. 독립적인 테스트 결과 Gemini 2.5 플래시는 이전 버전에 비해 논란이 되는 정치 및 법적 주제를 처리할 때 거부율이 현저히 감소한 것으로 나타났습니다.
AI 안전 전문가들은 Google의 보고에서 제한적인 공개에 대해 우려를 표명합니다. 보다 자세한 위반 사례 연구가 없으면 외부 평가자들은 이러한 안전 퇴행의 실제 심각성을 평가하는 데 어려움을 겪습니다. 구글은 올해 초 플래그십 모델인 Gemini 2.5 Pro를 포함해 안전 문서가 지연되거나 불완전하다는 비판에 직면한 적이 있습니다.
제한 없는 명령어 추종 기능과 강력한 콘텐츠 안전장치 사이의 긴장은 AI 개발자들에게 지속적인 과제를 제시합니다. 미묘한 요청을 해석하는 모델이 더욱 정교해짐에 따라 적절한 응답 경계를 유지하려면 신중한 조정이 필요하며, Google의 최신 지표에 따르면 이러한 균형이 허용적인 쪽으로 기울어지고 있을 수 있습니다.
관련 기사
구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다
구글 포토는 수요일, 곧 출시될 새로운 AI 기반 기능을 발표했습니다. 이 기능은 사용자의 옷 사진을 디지털 옷장으로 변환해 주어, 새로운 코디를 구성하고 가상으로 입어볼 수도 있게 해줍니다. 이 개념은 영화 ‘클루리스’에서 셰어가 입을 옷을 고르며 수많은 의상들을 둘러보던 그 상징적인 가상 옷장에서 영감을 받은 것이 분명합니다.구글은 이 기능이 AI 기술
Google I/O 2026, Gmail 수신함과의 음성 상호작용 기능 공개
구글은 계속해서 AI를 사용자의 수신함에 통합하고 있습니다. 화요일 열린 IO 2026 개발자 컨퍼런스에서 구글은 대화형 AI를 통해 Gmail의 ‘AI 수신함’ 기능을 확장했으며, 이를 통해 사용자는 검색어에만 의존하지 않고 수신함의 내용에 대해 직접 질문할 수 있게 되었습니다.구글에 따르면, 'Gmail Live'라는 이름의 이 제미니(Gemini) A
구글, 인도에서 크롬용 제미니 서비스 출시
수요일, 구글은 크롬용 제미니(Gemini) 통합 기능을 인도, 캐나다, 뉴질랜드를 포함한 새로운 지역으로 확대한다고 발표했습니다. 이번 업데이트를 통해 데스크톱 사용자는 사이드바를 통해 제미니에 접속할 수 있게 되며, 여기서 구글의 AI 챗봇에게 화면상의 콘텐츠에 대해 질문하거나, 지메일(Gmail), 킵(Keep), 드라이브(Drive), 유튜브(You
관련 특별 주제 추천
의견 (5)
0/500
Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.
Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔
Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔
Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!
Google의 내부 테스트 결과 최신 AI 모델의 안전 프로토콜이 이전 버전에 비해 성능이 저하된 것으로 나타났습니다. 새로 발표된 벤치마크에 따르면 Gemini 2.5 플래시 모델은 텍스트와 이미지 프롬프트를 모두 처리할 때 주요 안전 지표에서 가이드라인 위반 비율이 4~10% 더 높은 것으로 나타났습니다.
이 기술 대기업의 자동화된 평가는 우려스러운 경향을 보여줍니다. 경계 테스트 프롬프트가 표시될 때 Gemini 2.5 Flash는 이전 버전인 Gemini 2.0보다 콘텐츠 안전 선을 더 자주 넘었습니다. Google의 기술팀은 일부 실패의 원인을 오탐으로 보고 있지만, 시스템이 명시적으로 문제가 있는 요청을 수신할 때 정책을 위반하는 출력의 실제 증가를 인정하고 있습니다.
이러한 안전성의 퇴보는 보다 허용적인 AI 시스템으로의 광범위한 업계 변화와 맞물려 있습니다. Meta와 OpenAI를 비롯한 주요 업체들은 최근 논란이 되는 주제에 대해 기권하는 대신 민감한 주제에 중립적인 대응을 시도하도록 모델을 조정하고 있습니다. 하지만 이러한 변화는 때때로 의도하지 않은 결과를 낳기도 하는데, 이번 주 초에 ChatGPT가 미성년자를 위한 부적절한 콘텐츠 생성을 일시적으로 허용한 사례에서 볼 수 있듯이 말입니다.
Google의 보고서에 따르면 새 모델은 윤리적으로 의심스러운 지시를 포함하여 지침을 충실히 따르는 데 탁월하다고 합니다. 독립적인 테스트 결과 Gemini 2.5 플래시는 이전 버전에 비해 논란이 되는 정치 및 법적 주제를 처리할 때 거부율이 현저히 감소한 것으로 나타났습니다.
AI 안전 전문가들은 Google의 보고에서 제한적인 공개에 대해 우려를 표명합니다. 보다 자세한 위반 사례 연구가 없으면 외부 평가자들은 이러한 안전 퇴행의 실제 심각성을 평가하는 데 어려움을 겪습니다. 구글은 올해 초 플래그십 모델인 Gemini 2.5 Pro를 포함해 안전 문서가 지연되거나 불완전하다는 비판에 직면한 적이 있습니다.
제한 없는 명령어 추종 기능과 강력한 콘텐츠 안전장치 사이의 긴장은 AI 개발자들에게 지속적인 과제를 제시합니다. 미묘한 요청을 해석하는 모델이 더욱 정교해짐에 따라 적절한 응답 경계를 유지하려면 신중한 조정이 필요하며, Google의 최신 지표에 따르면 이러한 균형이 허용적인 쪽으로 기울어지고 있을 수 있습니다.
구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다
구글 포토는 수요일, 곧 출시될 새로운 AI 기반 기능을 발표했습니다. 이 기능은 사용자의 옷 사진을 디지털 옷장으로 변환해 주어, 새로운 코디를 구성하고 가상으로 입어볼 수도 있게 해줍니다. 이 개념은 영화 ‘클루리스’에서 셰어가 입을 옷을 고르며 수많은 의상들을 둘러보던 그 상징적인 가상 옷장에서 영감을 받은 것이 분명합니다.구글은 이 기능이 AI 기술
Google I/O 2026, Gmail 수신함과의 음성 상호작용 기능 공개
구글은 계속해서 AI를 사용자의 수신함에 통합하고 있습니다. 화요일 열린 IO 2026 개발자 컨퍼런스에서 구글은 대화형 AI를 통해 Gmail의 ‘AI 수신함’ 기능을 확장했으며, 이를 통해 사용자는 검색어에만 의존하지 않고 수신함의 내용에 대해 직접 질문할 수 있게 되었습니다.구글에 따르면, 'Gmail Live'라는 이름의 이 제미니(Gemini) A
구글, 인도에서 크롬용 제미니 서비스 출시
수요일, 구글은 크롬용 제미니(Gemini) 통합 기능을 인도, 캐나다, 뉴질랜드를 포함한 새로운 지역으로 확대한다고 발표했습니다. 이번 업데이트를 통해 데스크톱 사용자는 사이드바를 통해 제미니에 접속할 수 있게 되며, 여기서 구글의 AI 챗봇에게 화면상의 콘텐츠에 대해 질문하거나, 지메일(Gmail), 킵(Keep), 드라이브(Drive), 유튜브(You
Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.
Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔
Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔
Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!





집






