OpenAI, GPT-5 출시 도전장 속 롤아웃 장벽 맞닥뜨려

업데이트: 2025년 8월 8일 금요일 오후 5시 21분 ET: 이 기사가 게시된 직후, OpenAI의 공동 창립자이자 CEO인 샘 알트먼은 GPT-5 출시가 "기대했던 것보다 더 걷잡을 수 없이 진행되고 있다"고 인정하며, 선별된 사용자들에게 GPT-4o 및 기타 레거시 모델 접근 권한을 복구할 것이라고 확인했습니다.
살짝 말하면, OpenAI의 새 모델 GPT-5에 대한 높은 기대 속에 시작은 다소 삐걱거렸습니다.
어제 생중계된 공개 발표회에서의 차트 오류와 음성 데모 결함(별도의 4가지 모델과 그 중 세 모델에서 사용 가능한 "Thinking" 모드를 소개했던)을 잠시 눈감아 준다 해도, 출시 이후 여러 사용자 보고서는 GPT-5가 비교적 간단한 문제들을 해결하는 데 어려움을 겪고 있음을 보여주는데, 이러한 문제들은 이전 OpenAI 모델들과 경쟁 AI 연구실들의 경쟁 시스템들은 정확히 해결해냈습니다.
예를 들어, 데이터 과학자 콜린 프레이저는 GPT-5가 수학 증명, 특히 8.888 순환소수가 9와 같은지(같지 않습니다)를 잘못 처리하는 스크린샷을 공유했습니다.
와, 방금까지 그냥 갖고 놀고 있었는데 사실 진짜 멍청하네요 pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
또한 GPT-5는 많은 초등학생도 풀 수 있는 간단한 산수 방정식인 5.9 = x + 5.11에서도 실패했습니다.
이건 우려스럽네요. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
OpenAI의 자체적인 결함이 있는 발표 차트를 평가하는 데 GPT-5를 사용해도 유용하거나 정확한 답변을 얻지 못했습니다.
Q. LLM-as-a-judge 사용한 증명이 여전히 작동하지 않음을 보여주세요
A. pic.twitter.com/KnCK5Xs9ja
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
게다가, GPT-5는 이 더 까다로운 문장제 문제(인정하자면, 저조차도 처음에는 어려웠습니다. 비록 엘론 머스크의 Grok 4 AI는 정확히 답변했지만요. 힌트를 드리자면, 포장 블록은 갤 수 없으며 80개 모두 온전해야 합니다)에서도 실수를 했습니다.
울퉁불퉁한 개척지에 베이지 않도록 조심하세요 pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
제 테스트에서는 이전 GPT-4o 모델이 이러한 수학 문제 중 적어도 하나를 더 안정적으로 처리했습니다. 안타깝게도 OpenAI는 ChatGPT 사용자들을 위해 이전 기본 모델이었던 GPT-4o와 고급 추론 모델 o3를 포함한 those 이전 모델들을 점차 단계적으로 폐지하고 있지만, 당분간 개발자들은 API를 통해 계속 접근할 수 있을 것입니다.
코딩 성능, 벤치마크에 미치지 못해
OpenAI의 내부 벤치마크와 특정 제3자 테스트에서 GPT-5가 코딩 분야 최고 성능 모델로 나타났음에도 불구하고, 실제 사용 상황은 Anthropic이 최근 업그레이드한 Claude Opus 4.1이 "원-샷" 작업을 더 효과적으로 처리하는 경우가 많습니다. 즉, 사용자가 요청한 대로 의도한 애플리케이션이나 소프트웨어 빌드를 제공합니다. 개발자 저스틴 이 X에 게시한 이 예시를 참고하세요:
Opus 4.1의 "3D 카피바라 쓰다듬기 동물원 만들기"에 대한 원-샷 시도 – 총 8분 소요
이건 정말 굉장했어요, 카피바라들이 훨씬 더 귀엽고 움직일 뿐만 아니라, 개별적인 친밀도 레벨, 주야간 전환기, 먹이 주기, 심지어 스크린샷 기능까지 있어요 pic.twitter.com/FiKTO3FKK4
— justin (@justinsunyt) August 7, 2025
더욱이, 보안 업체 SPLX의 보고서에 따르면 OpenAI의 내부 안전 장치들은 비즈니스 정렬이나 프롬프트 인젝션 및 난독화된 논리 공격에 대한 취약성과 같은 영역에서 상당한 격차가 있는 것으로 나타났습니다.
비록 사례 중심이지만, AI 파워 사용자들의 초기 피드백은 전반적으로 미지근한 반응을 보였습니다.
AI 인플루언서이자 전 구글러인 빌라왈 시두는 X에서 팔로워들에게 "분위기 체크"를 묻는 투표를 진행했습니다. 지금까지 172표가 투표된 가운데, 우세한 응답은 "좀 그냥 그래요"였습니다.
자, GPT-5 분위기 체크
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
가명을 사용하는 AI Leaks and News 계정이 지적했듯이, "X와 레딧 AMA 모두에서 GPT-5에 대한 압도적인 공감대는 압도적으로 부정적입니다."
X와 레딧 AMA 양쪽 모두에서 GPT-5에 대한 압도적인 공감대는 압도적으로 부정적입니다
대부분의 사용자들은 고장난 모델 선택기와 비프로 사용자들이 레거시 모델에 접근할 수 없는 점에 대해 불만을 가지고 있습니다
GPT-5에 대한 당신의 초기 생각은 무엇인가요?
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
AIPRM의 리드 엔지니어이자 X에서 잘 알려진 AI 코멘테이터인 티보르 블라호는 ChatGPT-5 출시 문제점에 대한 철저한 요약을 작성했습니다. 그는 주요 기능 중 하나인 쿼리 복잡도에 따라 생각 모드 또는 비-생각 모드를 선택하는 자동 "라우터"가 많은 사용자들에게 비-생각 모드를 기본값으로 설정하는 경우가 많아 주요 불만 사항이 되었다고 지적했습니다.
GPT-5 출시가 이렇게까지 가네요, 특히 오랜 기다림과 높은 기대 이후라니 좀 슬픕니다
– 모델 간 자동 전환(라우터)이 부분적으로 고장났거나 불안정해 보입니다
– 당신이 실제로 어떤 모델(스탠다드 또는 미니, …)과 상호작용 중인지 불분명합니다
— Tibor Blaho (@btibor91) August 8, 2025
기회를 노리는 경쟁사들
그 결과, ChatGPT-5에 대한 여론은 결코 일관되게 긍정적이지 않으며, Google과 Anthropic과 같은 미국 거대 기업들로부터의 경쟁이 격화되고, 많은 미국 모델들이 갖추지 못한 능력을 제공하는 무료, 오픈 소스, 그리고 유능한 중국 대형 언어 모델들의 증가하는 명단으로 인해 OpenAI에게 심각한 도전 과제를 제기하고 있습니다.
알리바바 Qwen 연구팀을 예로 들어보세요. 그들은 오늘 자체 고성능 Qwen 3 모델을 100만 토큰의 컨텍스트를 지원하도록 업그레이드했습니다. 이렇게 하면 사용자들이 GPT-5가 현재 제공하는 것보다 거의 4배 더 많은 정보를 상호작용마다 교환할 수 있습니다.
OpenAI가 이번 주에 출시한 다른 주요 제품—새로운 오픈소스 gpt-oss 모델 시리즈—도 초기 평가가 엇갈리면서, 사용자를 선도하는 전문 AI 회사(ChatGPT는 현재 주간 활성 사용자 7억 명을 기록하고 있습니다)의 전망은 불확실합니다.
이러한 정서는 예측 시장 Polymarket에서도 반영되어, 사용자들은 2025년 8월 말까지 Google이 선도적인 AI 모델을 보유할 가능성이 매우 높다고 압도적으로 베팅했습니다.
Otherside AI의 공동 창립자이자 CEO인 매트 슈머와 같은 다른 파워 사용자—그는 일찍이 GPT-5 접근 권한을 얻었으며 긍정적인 평가를 발표했습니다—는 더 많은 사람들이 새 모델에 맞춰 자신들의 워크플로우를 최적화함에 따라 의견이 바뀔 수 있다고 제안했습니다:
나쁜 경험을 하고 있는 많은 분들은 GPT-5를 아직 최적화되지 않은 에이전트 하네스에서 사용하고 있습니다.
새로운 모델 출시마다, 출시와 모델을 통합하는 회사들이 제대로 작동하게 만들 때까지 시간 차이가 있습니다.
에이전트 회사들은 서두릅니다…
— Matt Shumer (@mattshumer_) August 8, 2025
GPT-5는 아직 초기 단계이며—더 많은 사람들이 다양한 작업에 대해 테스트함에 따라 의견이 크게 바뀔 수 있습니다—초기 징후들은 이번이 GPT-4, GPT-4o 또는 o3와 같은 이전 출시들이 나타냈던 "홈런"이 아니라는 것을 시사합니다. 이는 최근 추가 자금 조달 라운드를 확보했지만 높은 R&D 비용으로 인해 여전히 수익성을 내지 못하고 있는 회사에게는 불안한 신호입니다.
관련 기사
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크
관련 특별 주제 추천
의견 (1)
0/500

업데이트: 2025년 8월 8일 금요일 오후 5시 21분 ET: 이 기사가 게시된 직후, OpenAI의 공동 창립자이자 CEO인 샘 알트먼은 GPT-5 출시가 "기대했던 것보다 더 걷잡을 수 없이 진행되고 있다"고 인정하며, 선별된 사용자들에게 GPT-4o 및 기타 레거시 모델 접근 권한을 복구할 것이라고 확인했습니다.
살짝 말하면, OpenAI의 새 모델 GPT-5에 대한 높은 기대 속에 시작은 다소 삐걱거렸습니다.
어제 생중계된 공개 발표회에서의 차트 오류와 음성 데모 결함(별도의 4가지 모델과 그 중 세 모델에서 사용 가능한 "Thinking" 모드를 소개했던)을 잠시 눈감아 준다 해도, 출시 이후 여러 사용자 보고서는 GPT-5가 비교적 간단한 문제들을 해결하는 데 어려움을 겪고 있음을 보여주는데, 이러한 문제들은 이전 OpenAI 모델들과 경쟁 AI 연구실들의 경쟁 시스템들은 정확히 해결해냈습니다.
예를 들어, 데이터 과학자 콜린 프레이저는 GPT-5가 수학 증명, 특히 8.888 순환소수가 9와 같은지(같지 않습니다)를 잘못 처리하는 스크린샷을 공유했습니다.
와, 방금까지 그냥 갖고 놀고 있었는데 사실 진짜 멍청하네요 pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
또한 GPT-5는 많은 초등학생도 풀 수 있는 간단한 산수 방정식인 5.9 = x + 5.11에서도 실패했습니다.
이건 우려스럽네요. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
OpenAI의 자체적인 결함이 있는 발표 차트를 평가하는 데 GPT-5를 사용해도 유용하거나 정확한 답변을 얻지 못했습니다.
Q. LLM-as-a-judge 사용한 증명이 여전히 작동하지 않음을 보여주세요
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
A. pic.twitter.com/KnCK5Xs9ja
게다가, GPT-5는 이 더 까다로운 문장제 문제(인정하자면, 저조차도 처음에는 어려웠습니다. 비록 엘론 머스크의 Grok 4 AI는 정확히 답변했지만요. 힌트를 드리자면, 포장 블록은 갤 수 없으며 80개 모두 온전해야 합니다)에서도 실수를 했습니다.
울퉁불퉁한 개척지에 베이지 않도록 조심하세요 pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
제 테스트에서는 이전 GPT-4o 모델이 이러한 수학 문제 중 적어도 하나를 더 안정적으로 처리했습니다. 안타깝게도 OpenAI는 ChatGPT 사용자들을 위해 이전 기본 모델이었던 GPT-4o와 고급 추론 모델 o3를 포함한 those 이전 모델들을 점차 단계적으로 폐지하고 있지만, 당분간 개발자들은 API를 통해 계속 접근할 수 있을 것입니다.
코딩 성능, 벤치마크에 미치지 못해
OpenAI의 내부 벤치마크와 특정 제3자 테스트에서 GPT-5가 코딩 분야 최고 성능 모델로 나타났음에도 불구하고, 실제 사용 상황은 Anthropic이 최근 업그레이드한 Claude Opus 4.1이 "원-샷" 작업을 더 효과적으로 처리하는 경우가 많습니다. 즉, 사용자가 요청한 대로 의도한 애플리케이션이나 소프트웨어 빌드를 제공합니다. 개발자 저스틴 이 X에 게시한 이 예시를 참고하세요:
Opus 4.1의 "3D 카피바라 쓰다듬기 동물원 만들기"에 대한 원-샷 시도 – 총 8분 소요
— justin (@justinsunyt) August 7, 2025
이건 정말 굉장했어요, 카피바라들이 훨씬 더 귀엽고 움직일 뿐만 아니라, 개별적인 친밀도 레벨, 주야간 전환기, 먹이 주기, 심지어 스크린샷 기능까지 있어요 pic.twitter.com/FiKTO3FKK4
더욱이, 보안 업체 SPLX의 보고서에 따르면 OpenAI의 내부 안전 장치들은 비즈니스 정렬이나 프롬프트 인젝션 및 난독화된 논리 공격에 대한 취약성과 같은 영역에서 상당한 격차가 있는 것으로 나타났습니다.
비록 사례 중심이지만, AI 파워 사용자들의 초기 피드백은 전반적으로 미지근한 반응을 보였습니다.
AI 인플루언서이자 전 구글러인 빌라왈 시두는 X에서 팔로워들에게 "분위기 체크"를 묻는 투표를 진행했습니다. 지금까지 172표가 투표된 가운데, 우세한 응답은 "좀 그냥 그래요"였습니다.
자, GPT-5 분위기 체크
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
가명을 사용하는 AI Leaks and News 계정이 지적했듯이, "X와 레딧 AMA 모두에서 GPT-5에 대한 압도적인 공감대는 압도적으로 부정적입니다."
X와 레딧 AMA 양쪽 모두에서 GPT-5에 대한 압도적인 공감대는 압도적으로 부정적입니다
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
대부분의 사용자들은 고장난 모델 선택기와 비프로 사용자들이 레거시 모델에 접근할 수 없는 점에 대해 불만을 가지고 있습니다
GPT-5에 대한 당신의 초기 생각은 무엇인가요?
AIPRM의 리드 엔지니어이자 X에서 잘 알려진 AI 코멘테이터인 티보르 블라호는 ChatGPT-5 출시 문제점에 대한 철저한 요약을 작성했습니다. 그는 주요 기능 중 하나인 쿼리 복잡도에 따라 생각 모드 또는 비-생각 모드를 선택하는 자동 "라우터"가 많은 사용자들에게 비-생각 모드를 기본값으로 설정하는 경우가 많아 주요 불만 사항이 되었다고 지적했습니다.
GPT-5 출시가 이렇게까지 가네요, 특히 오랜 기다림과 높은 기대 이후라니 좀 슬픕니다
— Tibor Blaho (@btibor91) August 8, 2025
– 모델 간 자동 전환(라우터)이 부분적으로 고장났거나 불안정해 보입니다
– 당신이 실제로 어떤 모델(스탠다드 또는 미니, …)과 상호작용 중인지 불분명합니다
기회를 노리는 경쟁사들
그 결과, ChatGPT-5에 대한 여론은 결코 일관되게 긍정적이지 않으며, Google과 Anthropic과 같은 미국 거대 기업들로부터의 경쟁이 격화되고, 많은 미국 모델들이 갖추지 못한 능력을 제공하는 무료, 오픈 소스, 그리고 유능한 중국 대형 언어 모델들의 증가하는 명단으로 인해 OpenAI에게 심각한 도전 과제를 제기하고 있습니다.
알리바바 Qwen 연구팀을 예로 들어보세요. 그들은 오늘 자체 고성능 Qwen 3 모델을 100만 토큰의 컨텍스트를 지원하도록 업그레이드했습니다. 이렇게 하면 사용자들이 GPT-5가 현재 제공하는 것보다 거의 4배 더 많은 정보를 상호작용마다 교환할 수 있습니다.
OpenAI가 이번 주에 출시한 다른 주요 제품—새로운 오픈소스 gpt-oss 모델 시리즈—도 초기 평가가 엇갈리면서, 사용자를 선도하는 전문 AI 회사(ChatGPT는 현재 주간 활성 사용자 7억 명을 기록하고 있습니다)의 전망은 불확실합니다.
이러한 정서는 예측 시장 Polymarket에서도 반영되어, 사용자들은 2025년 8월 말까지 Google이 선도적인 AI 모델을 보유할 가능성이 매우 높다고 압도적으로 베팅했습니다.
Otherside AI의 공동 창립자이자 CEO인 매트 슈머와 같은 다른 파워 사용자—그는 일찍이 GPT-5 접근 권한을 얻었으며 긍정적인 평가를 발표했습니다—는 더 많은 사람들이 새 모델에 맞춰 자신들의 워크플로우를 최적화함에 따라 의견이 바뀔 수 있다고 제안했습니다:
나쁜 경험을 하고 있는 많은 분들은 GPT-5를 아직 최적화되지 않은 에이전트 하네스에서 사용하고 있습니다.
— Matt Shumer (@mattshumer_) August 8, 2025
새로운 모델 출시마다, 출시와 모델을 통합하는 회사들이 제대로 작동하게 만들 때까지 시간 차이가 있습니다.
에이전트 회사들은 서두릅니다…
GPT-5는 아직 초기 단계이며—더 많은 사람들이 다양한 작업에 대해 테스트함에 따라 의견이 크게 바뀔 수 있습니다—초기 징후들은 이번이 GPT-4, GPT-4o 또는 o3와 같은 이전 출시들이 나타냈던 "홈런"이 아니라는 것을 시사합니다. 이는 최근 추가 자금 조달 라운드를 확보했지만 높은 R&D 비용으로 인해 여전히 수익성을 내지 못하고 있는 회사에게는 불안한 신호입니다.
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크





집






