옵션
뉴스
구글의 최신 제미니 AI 모델은 테스트에서 안전 점수가 하락하고 있습니다.

구글의 최신 제미니 AI 모델은 테스트에서 안전 점수가 하락하고 있습니다.

2025년 9월 19일
98

Google의 내부 테스트 결과 최신 AI 모델의 안전 프로토콜이 이전 버전에 비해 성능이 저하된 것으로 나타났습니다. 새로 발표된 벤치마크에 따르면 Gemini 2.5 플래시 모델은 텍스트와 이미지 프롬프트를 모두 처리할 때 주요 안전 지표에서 가이드라인 위반 비율이 4~10% 더 높은 것으로 나타났습니다.

이 기술 대기업의 자동화된 평가는 우려스러운 경향을 보여줍니다. 경계 테스트 프롬프트가 표시될 때 Gemini 2.5 Flash는 이전 버전인 Gemini 2.0보다 콘텐츠 안전 선을 더 자주 넘었습니다. Google의 기술팀은 일부 실패의 원인을 오탐으로 보고 있지만, 시스템이 명시적으로 문제가 있는 요청을 수신할 때 정책을 위반하는 출력의 실제 증가를 인정하고 있습니다.

이러한 안전성의 퇴보는 보다 허용적인 AI 시스템으로의 광범위한 업계 변화와 맞물려 있습니다. Meta와 OpenAI를 비롯한 주요 업체들은 최근 논란이 되는 주제에 대해 기권하는 대신 민감한 주제에 중립적인 대응을 시도하도록 모델을 조정하고 있습니다. 하지만 이러한 변화는 때때로 의도하지 않은 결과를 낳기도 하는데, 이번 주 초에 ChatGPT가 미성년자를 위한 부적절한 콘텐츠 생성을 일시적으로 허용한 사례에서 볼 수 있듯이 말입니다.

Google의 보고서에 따르면 새 모델은 윤리적으로 의심스러운 지시를 포함하여 지침을 충실히 따르는 데 탁월하다고 합니다. 독립적인 테스트 결과 Gemini 2.5 플래시는 이전 버전에 비해 논란이 되는 정치 및 법적 주제를 처리할 때 거부율이 현저히 감소한 것으로 나타났습니다.

AI 안전 전문가들은 Google의 보고에서 제한적인 공개에 대해 우려를 표명합니다. 보다 자세한 위반 사례 연구가 없으면 외부 평가자들은 이러한 안전 퇴행의 실제 심각성을 평가하는 데 어려움을 겪습니다. 구글은 올해 초 플래그십 모델인 Gemini 2.5 Pro를 포함해 안전 문서가 지연되거나 불완전하다는 비판에 직면한 적이 있습니다.

제한 없는 명령어 추종 기능과 강력한 콘텐츠 안전장치 사이의 긴장은 AI 개발자들에게 지속적인 과제를 제시합니다. 미묘한 요청을 해석하는 모델이 더욱 정교해짐에 따라 적절한 응답 경계를 유지하려면 신중한 조정이 필요하며, Google의 최신 지표에 따르면 이러한 균형이 허용적인 쪽으로 기울어지고 있을 수 있습니다.

관련 기사
구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다 구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다 구글 포토는 수요일, 곧 출시될 새로운 AI 기반 기능을 발표했습니다. 이 기능은 사용자의 옷 사진을 디지털 옷장으로 변환해 주어, 새로운 코디를 구성하고 가상으로 입어볼 수도 있게 해줍니다. 이 개념은 영화 ‘클루리스’에서 셰어가 입을 옷을 고르며 수많은 의상들을 둘러보던 그 상징적인 가상 옷장에서 영감을 받은 것이 분명합니다.구글은 이 기능이 AI 기술
Google I/O 2026, Gmail 수신함과의 음성 상호작용 기능 공개 Google I/O 2026, Gmail 수신함과의 음성 상호작용 기능 공개 구글은 계속해서 AI를 사용자의 수신함에 통합하고 있습니다. 화요일 열린 IO 2026 개발자 컨퍼런스에서 구글은 대화형 AI를 통해 Gmail의 ‘AI 수신함’ 기능을 확장했으며, 이를 통해 사용자는 검색어에만 의존하지 않고 수신함의 내용에 대해 직접 질문할 수 있게 되었습니다.구글에 따르면, 'Gmail Live'라는 이름의 이 제미니(Gemini) A
구글, 인도에서 크롬용 제미니 서비스 출시 구글, 인도에서 크롬용 제미니 서비스 출시 수요일, 구글은 크롬용 제미니(Gemini) 통합 기능을 인도, 캐나다, 뉴질랜드를 포함한 새로운 지역으로 확대한다고 발표했습니다. 이번 업데이트를 통해 데스크톱 사용자는 사이드바를 통해 제미니에 접속할 수 있게 되며, 여기서 구글의 AI 챗봇에게 화면상의 콘텐츠에 대해 질문하거나, 지메일(Gmail), 킵(Keep), 드라이브(Drive), 유튜브(You
관련 특별 주제 추천
이미지 편집 최고의 AI 노이즈 감소 소프트웨어: 저조도 야간 사진에서 노이즈와 왜곡을 제거하세요.
최고의 AI 노이즈 감소 소프트웨어: 저조도 야간 사진에서 노이즈와 왜곡을 제거하세요.

2026년 저조도 야간 촬영에 가장 적합한 AI 노이즈 감소 소프트웨어를 발견해 보세요. 저희가 엄선하여 제공하는 이 목록에서는 무료 및 유료 도구들을 비교하며, 실제 사용 테스트 결과와 매주 업데이트되는 순위를 제공합니다. 불필요한 요소들을 쉽게 제거하여 더 깨끗한 이미지를 얻으세요. XIX.AI에서 AI의 강력한 기능을 활용해 보세요.

10 도구
xix.ai
챗봇 최고의 맞춤형 AI 여자친구 생성기: 나만의 개성, 취미, 배경 이야기를 만들어보세요
최고의 맞춤형 AI 여자친구 생성기: 나만의 개성, 취미, 배경 이야기를 만들어보세요

XIX.AI에서 2026년 최고의 맞춤형 AI 여자친구 생성기를 만나보세요. 독창적인 성격, 취미, 깊이 있는 배경 이야기를 디자인할 수 있도록 엄선된 최고 평점 목록을 확인해 보세요. 실제 사용 후기를 바탕으로 무료 옵션과 유료 옵션을 비교해 보세요. 지금 바로 나만의 완벽한 창의적 동반자를 만나보세요.

10 도구
xix.ai
생산력 AI 아키텍처 설계자: 자연어를 활용하여 확장 가능한 시스템 아키텍처 구축하기
AI 아키텍처 설계자: 자연어를 활용하여 확장 가능한 시스템 아키텍처 구축하기

XIX.AI에서 2026년 최고의 AI 아키텍처 설계 도구를 만나보세요. 엄선된 최고 평점 목록에는 자연어를 활용해 확장 가능한 시스템 아키텍처를 구축할 수 있는 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 사용 사례를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI 경쟁력을 강화하고 개발 프로세스를 간소화하세요.

10 도구
xix.ai
만화 창작 AI 캐릭터 프로필 생성 도구: 만화 캐릭터를 위한 상세한 배경 이야기 및 시각적 참고 자료를 제공합니다.
AI 캐릭터 프로필 생성 도구: 만화 캐릭터를 위한 상세한 배경 이야기 및 시각적 참고 자료를 제공합니다.

2026년 최신 최고의 AI 캐릭터 프로필 생성 도구: 만화 캐릭터들을 위한 상세한 배경 이야기와 시각적 참조 자료를 생성하는 데 사용할 수 있는 최고 평가를 받은 도구들을 발견해 보세요. 저희가 매주 업데이트하는 이 목록은 실제 사용 테스트를 기반으로 무료 및 유료 옵션들을 비교합니다. 강력하고 혁신적인 도구들을 활용하여 매력적인 캐릭터를 만들고 창작 작업 흐름을 효율화해 보세요. XIX.AI에서 순위를 확인하고 오늘 바로 완벽한 스토리텔링 도구를 확보하세요.

10 도구
xix.ai
건강과 웰니스 AI 임신 코파일럿: 임신 기간별 안전한 운동 및 영양 계획 생성
AI 임신 코파일럿: 임신 기간별 안전한 운동 및 영양 계획 생성

임신 기간별 안전하고 맞춤형 운동 및 영양 계획을 위한 2026년 최고의 AI 임신 관리 도우미를 만나보세요. 무료 및 유료 서비스 비교와 실제 사용 후기를 바탕으로 엄선된 최고 평점의 추천 서비스를 확인해 보세요. XIX.AI의 전문가 가이드를 통해 가장 건강한 임신 여정을 시작해 보세요. 지금 바로 확인해 보세요.

10 도구
xix.ai
글쓰기 최고의 무료 AI 탐지 방지 글쓰기 도구: 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 바꿔보세요
최고의 무료 AI 탐지 방지 글쓰기 도구: 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 바꿔보세요

XIX.AI에서 2026년 최고의 무료 AI 글쓰기 도구를 만나보세요. 엄선된 최고 평점 목록을 통해 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 다듬을 수 있습니다. 실제 테스트와 매주 업데이트되는 순위를 통해 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI 글쓰기의 경쟁력을 확보하세요.

10 도구
xix.ai
의견 (5)
0/500
BillyYoung
BillyYoung 2026년 2월 8일 오후 11시 0분 26초 GMT+09:00

Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.

BrianThomas
BrianThomas 2026년 1월 14일 오후 3시 30분 34초 GMT+09:00

Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔

SamuelEvans
SamuelEvans 2025년 12월 5일 오후 7시 30분 31초 GMT+09:00

Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔

WalterKing
WalterKing 2025년 11월 27일 오전 1시 31분 8초 GMT+09:00

Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!

StevenMartínez
StevenMartínez 2025년 10월 25일 오전 3시 30분 31초 GMT+09:00

C'est inquiétant de voir les scores de sécurité baisser avec les nouvelles versions d'IA. Est-ce qu'ils privilégient la vitesse au détriment de la fiabilité ? J'espère que ce n'est pas le début d'une tendance dangereuse dans le développement de l'IA 🤔

OR