OpenAI, GPT-5 출시 도전장 속 롤아웃 장벽 맞닥뜨려

집

뉴스

2025년 11월 26일

ChristopherThomas

# openai # gpt-5 # LLMs # nlp

OpenAI, GPT-5 출시 도전장 속 롤아웃 장벽 맞닥뜨려

업데이트: 2025년 8월 8일 금요일 오후 5시 21분 ET: 이 기사가 게시된 직후, OpenAI의 공동 창립자이자 CEO인 샘 알트먼은 GPT-5 출시가 "기대했던 것보다 더 걷잡을 수 없이 진행되고 있다"고 인정하며, 선별된 사용자들에게 GPT-4o 및 기타 레거시 모델 접근 권한을 복구할 것이라고 확인했습니다.

살짝 말하면, OpenAI의 새 모델 GPT-5에 대한 높은 기대 속에 시작은 다소 삐걱거렸습니다.

어제 생중계된 공개 발표회에서의 차트 오류와 음성 데모 결함(별도의 4가지 모델과 그 중 세 모델에서 사용 가능한 "Thinking" 모드를 소개했던)을 잠시 눈감아 준다 해도, 출시 이후 여러 사용자 보고서는 GPT-5가 비교적 간단한 문제들을 해결하는 데 어려움을 겪고 있음을 보여주는데, 이러한 문제들은 이전 OpenAI 모델들과 경쟁 AI 연구실들의 경쟁 시스템들은 정확히 해결해냈습니다.

예를 들어, 데이터 과학자 콜린 프레이저는 GPT-5가 수학 증명, 특히 8.888 순환소수가 9와 같은지(같지 않습니다)를 잘못 처리하는 스크린샷을 공유했습니다.

와, 방금까지 그냥 갖고 놀고 있었는데 사실 진짜 멍청하네요 pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025

또한 GPT-5는 많은 초등학생도 풀 수 있는 간단한 산수 방정식인 5.9 = x + 5.11에서도 실패했습니다.

이건 우려스럽네요. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025

OpenAI의 자체적인 결함이 있는 발표 차트를 평가하는 데 GPT-5를 사용해도 유용하거나 정확한 답변을 얻지 못했습니다.

Q. LLM-as-a-judge 사용한 증명이 여전히 작동하지 않음을 보여주세요

A. pic.twitter.com/KnCK5Xs9ja
— Kangwook Lee (@Kangwook_Lee) August 7, 2025

게다가, GPT-5는 이 더 까다로운 문장제 문제(인정하자면, 저조차도 처음에는 어려웠습니다. 비록 엘론 머스크의 Grok 4 AI는 정확히 답변했지만요. 힌트를 드리자면, 포장 블록은 갤 수 없으며 80개 모두 온전해야 합니다)에서도 실수를 했습니다.

울퉁불퉁한 개척지에 베이지 않도록 조심하세요 pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025

제 테스트에서는 이전 GPT-4o 모델이 이러한 수학 문제 중 적어도 하나를 더 안정적으로 처리했습니다. 안타깝게도 OpenAI는 ChatGPT 사용자들을 위해 이전 기본 모델이었던 GPT-4o와 고급 추론 모델 o3를 포함한 those 이전 모델들을 점차 단계적으로 폐지하고 있지만, 당분간 개발자들은 API를 통해 계속 접근할 수 있을 것입니다.

코딩 성능, 벤치마크에 미치지 못해

OpenAI의 내부 벤치마크와 특정 제3자 테스트에서 GPT-5가 코딩 분야 최고 성능 모델로 나타났음에도 불구하고, 실제 사용 상황은 Anthropic이 최근 업그레이드한 Claude Opus 4.1이 "원-샷" 작업을 더 효과적으로 처리하는 경우가 많습니다. 즉, 사용자가 요청한 대로 의도한 애플리케이션이나 소프트웨어 빌드를 제공합니다. 개발자 저스틴 이 X에 게시한 이 예시를 참고하세요:

Opus 4.1의 "3D 카피바라 쓰다듬기 동물원 만들기"에 대한 원-샷 시도 – 총 8분 소요

이건 정말 굉장했어요, 카피바라들이 훨씬 더 귀엽고 움직일 뿐만 아니라, 개별적인 친밀도 레벨, 주야간 전환기, 먹이 주기, 심지어 스크린샷 기능까지 있어요 pic.twitter.com/FiKTO3FKK4
— justin (@justinsunyt) August 7, 2025

더욱이, 보안 업체 SPLX의 보고서에 따르면 OpenAI의 내부 안전 장치들은 비즈니스 정렬이나 프롬프트 인젝션 및 난독화된 논리 공격에 대한 취약성과 같은 영역에서 상당한 격차가 있는 것으로 나타났습니다.

비록 사례 중심이지만, AI 파워 사용자들의 초기 피드백은 전반적으로 미지근한 반응을 보였습니다.

AI 인플루언서이자 전 구글러인 빌라왈 시두는 X에서 팔로워들에게 "분위기 체크"를 묻는 투표를 진행했습니다. 지금까지 172표가 투표된 가운데, 우세한 응답은 "좀 그냥 그래요"였습니다.

자, GPT-5 분위기 체크
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025

가명을 사용하는 AI Leaks and News 계정이 지적했듯이, "X와 레딧 AMA 모두에서 GPT-5에 대한 압도적인 공감대는 압도적으로 부정적입니다."

X와 레딧 AMA 양쪽 모두에서 GPT-5에 대한 압도적인 공감대는 압도적으로 부정적입니다

대부분의 사용자들은 고장난 모델 선택기와 비프로 사용자들이 레거시 모델에 접근할 수 없는 점에 대해 불만을 가지고 있습니다

GPT-5에 대한 당신의 초기 생각은 무엇인가요?
— AI Leaks and News (@AILeaksAndNews) August 8, 2025

AIPRM의 리드 엔지니어이자 X에서 잘 알려진 AI 코멘테이터인 티보르 블라호는 ChatGPT-5 출시 문제점에 대한 철저한 요약을 작성했습니다. 그는 주요 기능 중 하나인 쿼리 복잡도에 따라 생각 모드 또는 비-생각 모드를 선택하는 자동 "라우터"가 많은 사용자들에게 비-생각 모드를 기본값으로 설정하는 경우가 많아 주요 불만 사항이 되었다고 지적했습니다.

GPT-5 출시가 이렇게까지 가네요, 특히 오랜 기다림과 높은 기대 이후라니 좀 슬픕니다

– 모델 간 자동 전환(라우터)이 부분적으로 고장났거나 불안정해 보입니다

– 당신이 실제로 어떤 모델(스탠다드 또는 미니, …)과 상호작용 중인지 불분명합니다
— Tibor Blaho (@btibor91) August 8, 2025

기회를 노리는 경쟁사들

그 결과, ChatGPT-5에 대한 여론은 결코 일관되게 긍정적이지 않으며, Google과 Anthropic과 같은 미국 거대 기업들로부터의 경쟁이 격화되고, 많은 미국 모델들이 갖추지 못한 능력을 제공하는 무료, 오픈 소스, 그리고 유능한 중국 대형 언어 모델들의 증가하는 명단으로 인해 OpenAI에게 심각한 도전 과제를 제기하고 있습니다.

알리바바 Qwen 연구팀을 예로 들어보세요. 그들은 오늘 자체 고성능 Qwen 3 모델을 100만 토큰의 컨텍스트를 지원하도록 업그레이드했습니다. 이렇게 하면 사용자들이 GPT-5가 현재 제공하는 것보다 거의 4배 더 많은 정보를 상호작용마다 교환할 수 있습니다.

OpenAI가 이번 주에 출시한 다른 주요 제품—새로운 오픈소스 gpt-oss 모델 시리즈—도 초기 평가가 엇갈리면서, 사용자를 선도하는 전문 AI 회사(ChatGPT는 현재 주간 활성 사용자 7억 명을 기록하고 있습니다)의 전망은 불확실합니다.

이러한 정서는 예측 시장 Polymarket에서도 반영되어, 사용자들은 2025년 8월 말까지 Google이 선도적인 AI 모델을 보유할 가능성이 매우 높다고 압도적으로 베팅했습니다.

Otherside AI의 공동 창립자이자 CEO인 매트 슈머와 같은 다른 파워 사용자—그는 일찍이 GPT-5 접근 권한을 얻었으며 긍정적인 평가를 발표했습니다—는 더 많은 사람들이 새 모델에 맞춰 자신들의 워크플로우를 최적화함에 따라 의견이 바뀔 수 있다고 제안했습니다:

나쁜 경험을 하고 있는 많은 분들은 GPT-5를 아직 최적화되지 않은 에이전트 하네스에서 사용하고 있습니다.

새로운 모델 출시마다, 출시와 모델을 통합하는 회사들이 제대로 작동하게 만들 때까지 시간 차이가 있습니다.

에이전트 회사들은 서두릅니다…
— Matt Shumer (@mattshumer_) August 8, 2025

GPT-5는 아직 초기 단계이며—더 많은 사람들이 다양한 작업에 대해 테스트함에 따라 의견이 크게 바뀔 수 있습니다—초기 징후들은 이번이 GPT-4, GPT-4o 또는 o3와 같은 이전 출시들이 나타냈던 "홈런"이 아니라는 것을 시사합니다. 이는 최근 추가 자금 조달 라운드를 확보했지만 높은 R&D 비용으로 인해 여전히 수익성을 내지 못하고 있는 회사에게는 불안한 신호입니다.

관련 특별 주제 추천

사업

최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구

xix.ai

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

생산력

AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구

xix.ai

챗봇

최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구

xix.ai

교육 및 학습

최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구

xix.ai

챗봇

최고의 AI 유혹 및 대화 트레이너: 실시간으로 사회적 매력과 자신감을 높여보세요

XIX.AI에서 2026년 최고의 AI 플러팅 및 대화 트레이너를 만나보세요. 엄선된 최고 평점의 제품들을 통해 실시간으로 사회적 매력과 자신감을 키울 수 있습니다. 무료와 유료 버전을 비교하고 매주 업데이트되는 순위를 확인하며, 꼭 사용해봐야 할 획기적인 도구들을 탐색해 보세요. 지금 바로 여러분의 사회적 경쟁력을 한 단계 높여보세요.

10 도구

xix.ai

의견 (1)

0/500

먼저 로그인하십시오

DanielAllen

2026년 6월 1일 오후 7시 0분 19초 GMT+09:00

Honestly, I'm not surprised. OpenAI rushed GPT-4o and now they're backtracking? Classic move 😅. Hope they get it right eventually, but I'm sticking with Claude for now.

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다

더