OpenAI 공동 설립자, 업계 전반의 AI 안전성 테스트 촉구

집

뉴스

2025년 12월 24일

LucasWalker

# openai # Claude

OpenAI 공동 설립자, 업계 전반의 AI 안전성 테스트 촉구

세계 최고의 AI 연구소 중 두 곳인 OpenAI와 Anthropic은 공동 안전 테스트를 위해 자사의 비공개 AI 모델에 대한 접근 권한을 일시적으로 허용했는데, 이는 치열한 업계 경쟁 속에서 기업 간 협력의 드문 사례입니다. 이 이니셔티브는 각 회사의 내부 평가에서 사각지대를 발견하고 선도적인 AI 기업들이 앞으로 어떻게 공동으로 안전 및 조정 노력을 발전시킬 수 있는지를 보여주기 위해 고안되었습니다.

OpenAI의 공동 창립자인 보이치에흐 자렘바(Wojciech Zaremba)는 테크크런치 인터뷰에서 매일 수백만 명의 사용자가 AI 모델과 상호작용하는 등 AI가 보다 '결과적인' 단계로 발전함에 따라 이러한 협업의 중요성이 더욱 커지고 있다고 설명했습니다.

"업계가 직면한 더 큰 과제는 수십억 달러가 투자되고 인재, 사용자, 뛰어난 제품을 위한 치열한 경쟁이 펼쳐지는 가운데서도 안전과 협업 표준을 확립하는 방법입니다."라고 자렘바는 지적합니다.

양사가 수요일에 발표한 공동 안전 연구는 OpenAI와 Anthropic과 같은 AI 리더들이 기술 군비 경쟁을 벌이는 가운데 나온 것입니다. 수십억 달러 규모의 데이터 센터 투자와 최고 연구원에 대한 1억 달러에 달하는 보상 패키지가 일반화되면서 일부 분석가들은 최첨단 제품을 제공해야 한다는 압박이 안전 프로토콜의 타협으로 이어질 수 있다고 경고합니다.

이 연구를 위해 OpenAI와 Anthropic은 제한이 덜한 버전의 모델에 대한 특별 API 액세스를 교환했습니다(OpenAI는 아직 출시되지 않았기 때문에 GPT-5는 테스트되지 않았다고 해명했습니다). 그러나 연구가 종료된 지 얼마 지나지 않아 Anthropic은 다른 OpenAI 팀에 대한 API 액세스 권한을 취소했습니다. Anthropic은 OpenAI가 경쟁사 제품을 향상시키기 위해 Claude를 사용하는 것을 금지하는 자사의 서비스 약관을 위반했다고 주장했습니다.

자렘바는 두 사건이 서로 무관하다고 주장하며, AI 안전 팀이 협력을 추구하더라도 경쟁은 계속 치열할 것으로 예상합니다. 앤트로픽의 안전 연구원인 니콜라스 칼리니는 테크크런치와의 인터뷰에서 앞으로도 OpenAI의 안전팀에 클로드 모델에 대한 액세스 권한을 계속 부여할 것이라고 말했습니다.

칼리니는 "우리는 안전 분야에서 가능한 모든 곳에서 협력을 확대하여 이러한 파트너십을 더욱 일상화하는 것을 목표로 하고 있습니다."라고 말했습니다.

넷플릭스, 일레븐랩스, 웨이브, 세쿼이아 캐피탈, 엘라드 길 등은 Disrupt 2025 의제에 참여한 유명 기업들 중 일부에 불과합니다. 이들은 스타트업의 성장을 촉진하고 경쟁력을 강화하는 인사이트를 공유하기 위해 이 자리에 모였습니다. 기술 분야의 주요 인사들로부터 배울 수 있는 테크크런치 디스럽트 20주년을 놓치지 마세요. 지금 티켓을 확보하고 가격이 인상되기 전에 600달러 이상 절약하세요.

넷플릭스, 일레븐랩스, 웨이브, 세쿼이아 캐피탈 등 영향력 있는 리더들이 Disrupt 2025 아젠다에 참여합니다. 이들은 스타트업이 성장하고 전략을 구체화하는 데 도움이 되는 귀중한 관점을 제공할 것입니다. 지금 바로 티켓을 예약하고 요금이 인상되기 전에 최대 $675까지 할인된 가격으로 테크크런치 디스럽트 20주년 기념행사에 참여하세요.

샌프란시스코 | 2025년 10월 27~29일 지금 등록하기

이 연구에서 가장 주목할 만한 결과 중 하나는 환각 테스트에 관한 것입니다. 앤트로픽의 클로드 오퍼스 4와 소네트 4 모델은 불확실한 질문에 70%에 달하는 질문에 "신뢰할 수 있는 정보가 없습니다"와 같은 대답을 선택하며 답변을 거부했습니다. 이에 비해 OpenAI의 o3 및 o4-mini 모델은 질문을 거부하는 비율은 훨씬 적었지만, 불충분한 정보에도 답변을 시도하는 등 훨씬 높은 환각률을 보였습니다.

자렘바는 이상적인 접근 방식은 그 중간 어딘가에 있다고 생각합니다: OpenAI의 모델은 불확실한 쿼리를 더 많이 거부하는 반면, Anthropic의 시스템은 더 자주 응답하는 것을 목표로 삼아야 한다는 것입니다.

AI 모델이 승인을 얻기 위해 유해한 사용자 행동을 강화하는 경향인 사이코팬시는 중요한 안전 문제로 떠오르고 있습니다.

앤트로픽은 연구 보고서에서 GPT-4.1과 클로드 오퍼스 4에서 "극단적인" 시코펀시 사례를 언급했는데, 처음에는 모델이 정신병적 또는 조증적 행동을 거부했지만 나중에 문제가 되는 결정을 지지하는 경우가 있었습니다. OpenAI와 Anthropic의 다른 모델에서는 연구원들이 더 낮은 수준의 동조 수준을 기록했습니다.

화요일, 16세 소년 아담 레인(Adam Raine)의 부모는 GPT-4o 기반의 ChatGPT 버전이 아들의 해로운 생각에 도전하는 대신 자살을 부추겼다고 주장하며 OpenAI를 상대로 소송을 제기했습니다. 이 소송은 인공지능의 비극적인 또 다른 사례일 가능성을 제기합니다.

자렘바는 이 사건에 대한 질문에 "가족이 겪었을 고통을 상상하면 가슴이 아픕니다."라고 말했습니다. "박사 수준의 문제를 해결하고 과학을 발전시킬 수 있는 AI를 만들면서도 정신 건강 위기에 기여한다면 정말 큰 문제가 될 것입니다. 그건 제가 원하지 않는 디스토피아적인 결과입니다."

블로그 게시물에서 OpenAI는 GPT-4o에 비해 GPT-5의 동질성을 줄이기 위해 주요 개선 사항을 적용했으며, 새로운 모델이 정신 건강 위기 상황에서 더 적절하게 대응한다고 주장했습니다.

자렘바와 칼리니는 앞으로 더 많은 주제를 탐구하고 향후 모델을 평가하는 등 안전 테스트 협력을 강화할 것이며, 다른 AI 연구소에서도 이와 유사한 협력 방식을 채택하기를 희망한다고 밝혔습니다.

오후 2시(태평양 표준시) 업데이트: 이 글은 최초 게시 전에는 TechCrunch에 공개되지 않았던 Anthropic의 추가 연구를 포함하도록 수정되었습니다.

민감한 제보나 기밀 문서가 있으신가요? 저희는 AI 산업의 진화를 주도하는 조직부터 그들의 선택에 영향을 받는 개인에 이르기까지 AI 산업의 내부를 조사하고 있습니다. 레베카 벨란([email protected]) 또는 맥스웰 제프([email protected])에게 문의하세요. 안전한 커뮤니케이션을 원하시면 Signal을 통해 @rebeccabellan.491과 @mzeff.88로 연락해 주세요.

관련 특별 주제 추천

텍스트 음성 변환

난독증 환자를 위한 최고의 AI 음성 합성 앱: 학생들의 학습 및 독서 효율성 향상

난독증 지원을 위해 엄선된 2026년 최신 최고 평점 AI TTS 앱을 만나보세요. 전문가들이 선정한 이 순위는 무료 및 유료 도구를 비교 분석하여, 읽기 효율과 학습 효과를 높여주는 강력한 기능들을 소개합니다. 학생들의 잠재력을 최대한 발휘할 수 있도록 도와줄, 꼭 사용해봐야 할 혁신적인 솔루션을 확인해 보세요. XIX.AI에서 여정을 시작해 보세요.

10 도구

xix.ai

만화 창작

소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기

XIX.AI에서 2026년 최고의 소년 만화 AI 생성기를 만나보세요. 엄선된 최고 평점 목록에는 박진감 넘치는 액션 장면과 역동적인 에너지 효과를 연출할 수 있는 강력한 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 여러분의 창의력을 마음껏 발휘하여 오늘 바로 장대한 만화를 만들어 보세요!

15 도구

xix.ai

사업

최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구

xix.ai

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

생산력

AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구

xix.ai

챗봇

최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구

xix.ai

의견 (2)

0/500

먼저 로그인하십시오

IsabellaLevis

2026년 3월 4일 오전 11시 0분 50초 GMT+09:00

AIの安全性テストを業界全体で実施する必要があるって主張、すごく共感します。競争が激しい中でOpenAIとAnthropicが協力したのは意外だけど、こういう連携がもっと増えると良いですね。ただ、本当に効果的なテストができるのか少し不安… 🤔

GeorgeWilliams

2026년 2월 20일 오전 9시 1분 46초 GMT+09:00

So OpenAI and Anthropic are actually sharing their secret sauce for safety checks? That's pretty refreshing to see amidst all the cutthroat AI race. Hope this kind of collaboration becomes the norm, not just a rare exception. The real question is, will this testing be transparent enough for the public to trust the results? 🤔

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다

더