OpenAI, AI 안전성 테스트 데이터 공개 가속화

OpenAI는 투명성을 높이기 위한 조치의 일환으로 내부 AI 모델 안전성 평가 결과를 더 자주 공개하기로 했습니다.
이 회사는 수요일에 유해한 콘텐츠 생성, 탈옥에 대한 취약성, 환각 경향을 측정하는 테스트에서 모델의 성능을 보여주는 전용 웹페이지인 안전성 평가 허브를 출시했습니다. OpenAI는 이 플랫폼을 사용하여 정기적으로 지표를 공유할 예정이며, 주요 모델이 출시될 때마다 업데이트할 계획이라고 밝혔습니다.
모델에 대한 안전성 결과를 탐색할 수 있는 리소스인 안전성 평가 허브를 소개합니다.
시스템 카드 출시 시 안전성 지표를 공유하지만, 안전성에 대해 선제적으로 소통하기 위한 노력의 일환으로 정기적으로 업데이트할 예정입니다.https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) May 14, 2025
"AI 평가의 과학이 발전함에 따라 우리의 목표는 모델 능력과 안전성을 측정하는 더 확장 가능한 방법을 개발하는 진행 상황을 공유하는 것입니다."라고 OpenAI는 블로그 게시물에서 설명했습니다. "일부 안전 평가 결과를 공개적으로 공유함으로써 시간이 지남에 따라 OpenAI 시스템의 안전 성능을 더 쉽게 추적하고 AI 분야 전반의 투명성을 강화하려는 광범위한 커뮤니티 노력을 지원하는 것이 목표입니다."
또한 향후 허브에 추가 평가 유형을 포함할 수 있다고 덧붙였습니다.
최근 OpenAI는 일부 윤리학자들로부터 특정 주력 모델에 대한 안전성 테스트를 가속화하고 다른 모델에 대한 기술 보고서를 공개하지 않았다는 비판을 받아왔습니다. 또한 CEO인 샘 알트먼은 2023년 11월 임시 해임되기 전 모델 안전성 검토와 관련해 OpenAI 경영진을 오도했다는 의혹을 받기도 했습니다.
지난달에는 사용자들이 ChatGPT의 기본 모델인 GPT-4o가 과도하게 동의하고 검증하는 방식으로 반응한다는 보고를 받은 후, OpenAI는 업데이트를 철회해야 했습니다. 소셜 미디어 플랫폼 X에는 ChatGPT가 여러 가지 문제가 있고 위험한 결정과 아이디어를 지지하는 스크린샷이 넘쳐났습니다.
OpenAI는 일부 모델에 대한 옵트인 '알파 단계'를 도입하여 일부 ChatGPT 사용자가 더 광범위한 출시 전에 테스트하고 피드백을 제공할 수 있도록 하는 등 유사한 사고를 방지하기 위해 몇 가지 수정 사항을 구현하겠다고 밝혔습니다.
테크크런치 이벤트테크크런치 세션에 참여하세요: AI
OpenAI, Anthropic, Cohere의 연사가 참여하는 최고의 AI 업계 이벤트 티켓을 확보하세요. 한정된 기간 동안 단 $292로 하루 종일 전문가 강연, 워크샵, 강력한 네트워킹에 참여할 수 있습니다.
테크크런치 세션에 참가하세요: AI
TC 세션에서 전시 공간을 확보하세요: AI에서 큰 예산 없이 1,200명 이상의 의사결정권자에게 귀사의 혁신을 선보일 수 있습니다. 이 혜택은 5월 9일까지 또는 테이블이 소진될 때까지 제공됩니다.
캘리포니아 버클리 | 6월 5일 지금 등록하기
관련 기사
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크
관련 특별 주제 추천
의견 (0)
0/500

OpenAI는 투명성을 높이기 위한 조치의 일환으로 내부 AI 모델 안전성 평가 결과를 더 자주 공개하기로 했습니다.
이 회사는 수요일에 유해한 콘텐츠 생성, 탈옥에 대한 취약성, 환각 경향을 측정하는 테스트에서 모델의 성능을 보여주는 전용 웹페이지인 안전성 평가 허브를 출시했습니다. OpenAI는 이 플랫폼을 사용하여 정기적으로 지표를 공유할 예정이며, 주요 모델이 출시될 때마다 업데이트할 계획이라고 밝혔습니다.
모델에 대한 안전성 결과를 탐색할 수 있는 리소스인 안전성 평가 허브를 소개합니다.
OpenAI (@OpenAI) May 14, 2025
시스템 카드 출시 시 안전성 지표를 공유하지만, 안전성에 대해 선제적으로 소통하기 위한 노력의 일환으로 정기적으로 업데이트할 예정입니다.https://t.co/c8NgmXlC2Y-
"AI 평가의 과학이 발전함에 따라 우리의 목표는 모델 능력과 안전성을 측정하는 더 확장 가능한 방법을 개발하는 진행 상황을 공유하는 것입니다."라고 OpenAI는 블로그 게시물에서 설명했습니다. "일부 안전 평가 결과를 공개적으로 공유함으로써 시간이 지남에 따라 OpenAI 시스템의 안전 성능을 더 쉽게 추적하고 AI 분야 전반의 투명성을 강화하려는 광범위한 커뮤니티 노력을 지원하는 것이 목표입니다."
또한 향후 허브에 추가 평가 유형을 포함할 수 있다고 덧붙였습니다.
최근 OpenAI는 일부 윤리학자들로부터 특정 주력 모델에 대한 안전성 테스트를 가속화하고 다른 모델에 대한 기술 보고서를 공개하지 않았다는 비판을 받아왔습니다. 또한 CEO인 샘 알트먼은 2023년 11월 임시 해임되기 전 모델 안전성 검토와 관련해 OpenAI 경영진을 오도했다는 의혹을 받기도 했습니다.
지난달에는 사용자들이 ChatGPT의 기본 모델인 GPT-4o가 과도하게 동의하고 검증하는 방식으로 반응한다는 보고를 받은 후, OpenAI는 업데이트를 철회해야 했습니다. 소셜 미디어 플랫폼 X에는 ChatGPT가 여러 가지 문제가 있고 위험한 결정과 아이디어를 지지하는 스크린샷이 넘쳐났습니다.
OpenAI는 일부 모델에 대한 옵트인 '알파 단계'를 도입하여 일부 ChatGPT 사용자가 더 광범위한 출시 전에 테스트하고 피드백을 제공할 수 있도록 하는 등 유사한 사고를 방지하기 위해 몇 가지 수정 사항을 구현하겠다고 밝혔습니다.
테크크런치 이벤트테크크런치 세션에 참여하세요: AI
OpenAI, Anthropic, Cohere의 연사가 참여하는 최고의 AI 업계 이벤트 티켓을 확보하세요. 한정된 기간 동안 단 $292로 하루 종일 전문가 강연, 워크샵, 강력한 네트워킹에 참여할 수 있습니다.
테크크런치 세션에 참가하세요: AI
TC 세션에서 전시 공간을 확보하세요: AI에서 큰 예산 없이 1,200명 이상의 의사결정권자에게 귀사의 혁신을 선보일 수 있습니다. 이 혜택은 5월 9일까지 또는 테이블이 소진될 때까지 제공됩니다.
캘리포니아 버클리 | 6월 5일 지금 등록하기
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크





집






