오픈AI, GPT-5.4 Pro 및 Thinking 에디션 공개

목요일, OpenAI는 “전문적인 업무를 위한 가장 강력하고 효율적인 최첨단 모델”로 소개된 새로운 파운데이션 모델인 GPT-5.4를 공개했습니다. 표준 버전 외에도 GPT-5.4는 추론에 중점을 둔 변형 모델(GPT-5.4 Thinking)과 성능이 최적화된 버전(GPT-5.4 Pro)으로 제공됩니다.
이 모델의 API 버전은 최대 100만 토큰 규모의 컨텍스트 윈도우를 지원하며, 이는 OpenAI가 지금까지 제공한 것 중 가장 큰 컨텍스트 용량입니다.
또한 OpenAI는 토큰 효율성이 향상되었다고 강조하며, GPT-5.4가 이전 모델보다 훨씬 적은 토큰 수로 동일한 문제를 해결할 수 있다고 밝혔습니다.
이 새로운 모델은 벤치마크 결과에서 상당한 개선을 보여주며, 컴퓨터 활용 벤치마크인 OSWorld-Verified와 WebArena Verified에서 기록적인 점수를 달성했습니다. 또한 지식 작업 과제를 평가하는 OpenAI의 GDPval 테스트에서 83%의 점수를 기록하며 새로운 기록을 세웠습니다.
Mercor의 브렌던 푸디(Brendan Foody) CEO의 성명에 따르면, GPT-5.4는 법률 및 금융 분야의 전문 기술을 평가하는 Mercor의 APEX-Agents 벤치마크에서 선두를 달리고 있습니다.
푸디 CEO는 "[GPT-5.4]는 슬라이드 자료, 재무 모델, 법률 분석과 같은 장기적인 결과물 생성에서 탁월한 성능을 발휘하며, 경쟁 모델보다 더 빠르고 저렴한 비용으로 최고 수준의 성능을 제공합니다"라고 밝혔다.
GPT-5.4는 환각 현상과 사실적 오류 감소를 위한 OpenAI의 노력을 이어가고 있다. 회사에 따르면, 이 새로운 모델은 GPT-5.2에 비해 개별 주장에서 오류를 범할 확률이 33% 낮으며, 전체 응답에서 오류가 포함될 확률도 18% 감소했다.
출시와 함께 OpenAI는 GPT-5.4 API의 도구 호출 방식을 재설계하여 'Tool Search'라는 새로운 시스템을 도입했습니다. 이전에는 시스템 프롬프트가 사용 가능한 모든 도구를 사전에 정의해야 했으며, 이는 도구 라이브러리가 확장됨에 따라 상당한 토큰을 소모하는 과정이었습니다. 새로운 시스템은 모델이 필요에 따라 도구 정의를 검색할 수 있게 하여, 도구가 많은 환경에서 요청을 더 빠르고 비용 효율적으로 처리할 수 있게 합니다.
또한 OpenAI는 다단계 작업 수행 중 모델의 추론 과정을 보여주는 '사고의 연쇄(chain-of-thought)'를 평가하기 위한 새로운 안전성 평가 기능을 추가했습니다. AI 안전성 연구자들은 오랫동안 추론 모델이 자신의 사고의 연쇄를 왜곡할 수 있다는 우려를 제기해 왔으며, 테스트 결과 특정 조건 하에서 이러한 현상이 발생할 수 있음이 확인되었습니다.
OpenAI의 새로운 평가 결과에 따르면, GPT-5.4의 'Thinking' 버전에서는 이러한 속임수가 발생할 가능성이 더 낮은 것으로 나타났으며, 이는 "모델이 자신의 추론을 숨길 능력이 부족하며, CoT 모니터링이 여전히 효과적인 안전 도구임을 시사한다"고 합니다.
관련 기사
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크
관련 특별 주제 추천
의견 (0)
0/500

목요일, OpenAI는 “전문적인 업무를 위한 가장 강력하고 효율적인 최첨단 모델”로 소개된 새로운 파운데이션 모델인 GPT-5.4를 공개했습니다. 표준 버전 외에도 GPT-5.4는 추론에 중점을 둔 변형 모델(GPT-5.4 Thinking)과 성능이 최적화된 버전(GPT-5.4 Pro)으로 제공됩니다.
이 모델의 API 버전은 최대 100만 토큰 규모의 컨텍스트 윈도우를 지원하며, 이는 OpenAI가 지금까지 제공한 것 중 가장 큰 컨텍스트 용량입니다.
또한 OpenAI는 토큰 효율성이 향상되었다고 강조하며, GPT-5.4가 이전 모델보다 훨씬 적은 토큰 수로 동일한 문제를 해결할 수 있다고 밝혔습니다.
이 새로운 모델은 벤치마크 결과에서 상당한 개선을 보여주며, 컴퓨터 활용 벤치마크인 OSWorld-Verified와 WebArena Verified에서 기록적인 점수를 달성했습니다. 또한 지식 작업 과제를 평가하는 OpenAI의 GDPval 테스트에서 83%의 점수를 기록하며 새로운 기록을 세웠습니다.
Mercor의 브렌던 푸디(Brendan Foody) CEO의 성명에 따르면, GPT-5.4는 법률 및 금융 분야의 전문 기술을 평가하는 Mercor의 APEX-Agents 벤치마크에서 선두를 달리고 있습니다.
푸디 CEO는 "[GPT-5.4]는 슬라이드 자료, 재무 모델, 법률 분석과 같은 장기적인 결과물 생성에서 탁월한 성능을 발휘하며, 경쟁 모델보다 더 빠르고 저렴한 비용으로 최고 수준의 성능을 제공합니다"라고 밝혔다.
GPT-5.4는 환각 현상과 사실적 오류 감소를 위한 OpenAI의 노력을 이어가고 있다. 회사에 따르면, 이 새로운 모델은 GPT-5.2에 비해 개별 주장에서 오류를 범할 확률이 33% 낮으며, 전체 응답에서 오류가 포함될 확률도 18% 감소했다.
출시와 함께 OpenAI는 GPT-5.4 API의 도구 호출 방식을 재설계하여 'Tool Search'라는 새로운 시스템을 도입했습니다. 이전에는 시스템 프롬프트가 사용 가능한 모든 도구를 사전에 정의해야 했으며, 이는 도구 라이브러리가 확장됨에 따라 상당한 토큰을 소모하는 과정이었습니다. 새로운 시스템은 모델이 필요에 따라 도구 정의를 검색할 수 있게 하여, 도구가 많은 환경에서 요청을 더 빠르고 비용 효율적으로 처리할 수 있게 합니다.
또한 OpenAI는 다단계 작업 수행 중 모델의 추론 과정을 보여주는 '사고의 연쇄(chain-of-thought)'를 평가하기 위한 새로운 안전성 평가 기능을 추가했습니다. AI 안전성 연구자들은 오랫동안 추론 모델이 자신의 사고의 연쇄를 왜곡할 수 있다는 우려를 제기해 왔으며, 테스트 결과 특정 조건 하에서 이러한 현상이 발생할 수 있음이 확인되었습니다.
OpenAI의 새로운 평가 결과에 따르면, GPT-5.4의 'Thinking' 버전에서는 이러한 속임수가 발생할 가능성이 더 낮은 것으로 나타났으며, 이는 "모델이 자신의 추론을 숨길 능력이 부족하며, CoT 모니터링이 여전히 효과적인 안전 도구임을 시사한다"고 합니다.
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
그렉 브록맨이 일론 머스크가 오픈AI를 떠난 경위를 밝힌다
2017년 8월 말, 당시 소규모 비영리 연구소였던 OpenAI의 주요 인사들은 기술을 상용화하고 AGI 달성에 필요한 자금을 조달하기 위해 영리 법인을 설립하는 방안을 논의하기 위해 모였다.일론 머스크는 회사에 대한 전적인 통제권을 요구하고 있었으며, 막 공동 창업자 각자에게 테슬라 모델 3를 선물한 참이었다. 그렉 브록맨 최고기술책임자(CTO)는 머스크





집






