구글의 최신 제미니 AI 모델은 테스트에서 안전 점수가 하락하고 있습니다.

집

뉴스

2025년 9월 19일

JasonHill

# Gemini # Google

Google의 내부 테스트 결과 최신 AI 모델의 안전 프로토콜이 이전 버전에 비해 성능이 저하된 것으로 나타났습니다. 새로 발표된 벤치마크에 따르면 Gemini 2.5 플래시 모델은 텍스트와 이미지 프롬프트를 모두 처리할 때 주요 안전 지표에서 가이드라인 위반 비율이 4~10% 더 높은 것으로 나타났습니다.

이 기술 대기업의 자동화된 평가는 우려스러운 경향을 보여줍니다. 경계 테스트 프롬프트가 표시될 때 Gemini 2.5 Flash는 이전 버전인 Gemini 2.0보다 콘텐츠 안전 선을 더 자주 넘었습니다. Google의 기술팀은 일부 실패의 원인을 오탐으로 보고 있지만, 시스템이 명시적으로 문제가 있는 요청을 수신할 때 정책을 위반하는 출력의 실제 증가를 인정하고 있습니다.

이러한 안전성의 퇴보는 보다 허용적인 AI 시스템으로의 광범위한 업계 변화와 맞물려 있습니다. Meta와 OpenAI를 비롯한 주요 업체들은 최근 논란이 되는 주제에 대해 기권하는 대신 민감한 주제에 중립적인 대응을 시도하도록 모델을 조정하고 있습니다. 하지만 이러한 변화는 때때로 의도하지 않은 결과를 낳기도 하는데, 이번 주 초에 ChatGPT가 미성년자를 위한 부적절한 콘텐츠 생성을 일시적으로 허용한 사례에서 볼 수 있듯이 말입니다.

Google의 보고서에 따르면 새 모델은 윤리적으로 의심스러운 지시를 포함하여 지침을 충실히 따르는 데 탁월하다고 합니다. 독립적인 테스트 결과 Gemini 2.5 플래시는 이전 버전에 비해 논란이 되는 정치 및 법적 주제를 처리할 때 거부율이 현저히 감소한 것으로 나타났습니다.

AI 안전 전문가들은 Google의 보고에서 제한적인 공개에 대해 우려를 표명합니다. 보다 자세한 위반 사례 연구가 없으면 외부 평가자들은 이러한 안전 퇴행의 실제 심각성을 평가하는 데 어려움을 겪습니다. 구글은 올해 초 플래그십 모델인 Gemini 2.5 Pro를 포함해 안전 문서가 지연되거나 불완전하다는 비판에 직면한 적이 있습니다.

제한 없는 명령어 추종 기능과 강력한 콘텐츠 안전장치 사이의 긴장은 AI 개발자들에게 지속적인 과제를 제시합니다. 미묘한 요청을 해석하는 모델이 더욱 정교해짐에 따라 적절한 응답 경계를 유지하려면 신중한 조정이 필요하며, Google의 최신 지표에 따르면 이러한 균형이 허용적인 쪽으로 기울어지고 있을 수 있습니다.

관련 특별 주제 추천

이미지 편집

최고의 AI 노이즈 감소 소프트웨어: 저조도 야간 사진에서 노이즈와 왜곡을 제거하세요.

2026년 저조도 야간 촬영에 가장 적합한 AI 노이즈 감소 소프트웨어를 발견해 보세요. 저희가 엄선하여 제공하는 이 목록에서는 무료 및 유료 도구들을 비교하며, 실제 사용 테스트 결과와 매주 업데이트되는 순위를 제공합니다. 불필요한 요소들을 쉽게 제거하여 더 깨끗한 이미지를 얻으세요. XIX.AI에서 AI의 강력한 기능을 활용해 보세요.

10 도구

xix.ai

챗봇

최고의 맞춤형 AI 여자친구 생성기: 나만의 개성, 취미, 배경 이야기를 만들어보세요

XIX.AI에서 2026년 최고의 맞춤형 AI 여자친구 생성기를 만나보세요. 독창적인 성격, 취미, 깊이 있는 배경 이야기를 디자인할 수 있도록 엄선된 최고 평점 목록을 확인해 보세요. 실제 사용 후기를 바탕으로 무료 옵션과 유료 옵션을 비교해 보세요. 지금 바로 나만의 완벽한 창의적 동반자를 만나보세요.

10 도구

xix.ai

생산력

AI 아키텍처 설계자: 자연어를 활용하여 확장 가능한 시스템 아키텍처 구축하기

XIX.AI에서 2026년 최고의 AI 아키텍처 설계 도구를 만나보세요. 엄선된 최고 평점 목록에는 자연어를 활용해 확장 가능한 시스템 아키텍처를 구축할 수 있는 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 사용 사례를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI 경쟁력을 강화하고 개발 프로세스를 간소화하세요.

10 도구

xix.ai

만화 창작

AI 캐릭터 프로필 생성 도구: 만화 캐릭터를 위한 상세한 배경 이야기 및 시각적 참고 자료를 제공합니다.

2026년 최신 최고의 AI 캐릭터 프로필 생성 도구: 만화 캐릭터들을 위한 상세한 배경 이야기와 시각적 참조 자료를 생성하는 데 사용할 수 있는 최고 평가를 받은 도구들을 발견해 보세요. 저희가 매주 업데이트하는 이 목록은 실제 사용 테스트를 기반으로 무료 및 유료 옵션들을 비교합니다. 강력하고 혁신적인 도구들을 활용하여 매력적인 캐릭터를 만들고 창작 작업 흐름을 효율화해 보세요. XIX.AI에서 순위를 확인하고 오늘 바로 완벽한 스토리텔링 도구를 확보하세요.

10 도구

xix.ai

건강과 웰니스

AI 임신 코파일럿: 임신 기간별 안전한 운동 및 영양 계획 생성

임신 기간별 안전하고 맞춤형 운동 및 영양 계획을 위한 2026년 최고의 AI 임신 관리 도우미를 만나보세요. 무료 및 유료 서비스 비교와 실제 사용 후기를 바탕으로 엄선된 최고 평점의 추천 서비스를 확인해 보세요. XIX.AI의 전문가 가이드를 통해 가장 건강한 임신 여정을 시작해 보세요. 지금 바로 확인해 보세요.

10 도구

xix.ai

글쓰기

최고의 무료 AI 탐지 방지 글쓰기 도구: 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 바꿔보세요

XIX.AI에서 2026년 최고의 무료 AI 글쓰기 도구를 만나보세요. 엄선된 최고 평점 목록을 통해 기계적인 초안을 자연스럽고 사람처럼 읽히는 문장으로 다듬을 수 있습니다. 실제 테스트와 매주 업데이트되는 순위를 통해 무료 및 유료 옵션을 비교해 보세요. 지금 바로 AI 글쓰기의 경쟁력을 확보하세요.

10 도구

xix.ai

의견 (5)

0/500

먼저 로그인하십시오

BillyYoung

2026년 2월 8일 오후 11시 0분 26초 GMT+09:00

Это немного тревожно... Google продолжает выпускать всё более мощные модели, но безопасность, похоже, отстаёт 📉. Если с точки зрения оценки безопасности наблюдается такая тенденция, то что происходит с реальными пользователями? Возможно, им стоит притормозить гонку и сосредоточиться на прочной инфраструктуре безопасности.

BrianThomas

2026년 1월 14일 오후 3시 30분 34초 GMT+09:00

Isso é preocupante... A Google sempre foi referência em IA responsável, mas parece que a corrida pela performance está afetando a segurança. Será que estão lançando modelos muito rápido? Essa queda de 4-10% nas métricas de segurança não é pouca coisa, especialmente para um modelo que será usado por milhões. Espero que corrijam isso antes de uma implantação mais ampla. A competição com a OpenAI e outros não pode comprometer os padrões éticos. 🤔

SamuelEvans

2025년 12월 5일 오후 7시 30분 31초 GMT+09:00

Interesting read! As AI models get more powerful, it seems like safety testing is becoming the real bottleneck. Makes you wonder if the rush to release new versions is outpacing the ability to properly vet them. Hope Google prioritizes fixing this before scaling further. 🤔

WalterKing

2025년 11월 27일 오전 1시 31분 8초 GMT+09:00

Das ist ja mal echt beunruhigend... Warum werden die Sicherheitsstandards bei neuen KI-Modellen eigentlich immer schwächer? 😟 Sollte es nicht genau umgekehrt sein? Ich frage mich, ob das nur bei Google passiert oder ob andere Anbieter ähnliche Probleme haben. Vielleicht sollten sie lieber weniger auf Geschwindigkeit und mehr auf Sicherheit achten!

StevenMartínez

2025년 10월 25일 오전 3시 30분 31초 GMT+09:00

C'est inquiétant de voir les scores de sécurité baisser avec les nouvelles versions d'IA. Est-ce qu'ils privilégient la vitesse au détriment de la fiabilité ? J'espère que ce n'est pas le début d'une tendance dangereuse dans le développement de l'IA 🤔

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다

더