옵션
소식
OpenAi는 GPT-4.5 'Orion'을 출시합니다 : 현재까지 가장 큰 AI 모델

OpenAi는 GPT-4.5 'Orion'을 출시합니다 : 현재까지 가장 큰 AI 모델

2025년 4월 10일
98

오후 2시 40 분 PT : GPT-4.5가 출시 된 지 몇 시간 만에 Openai는 AI 모델의 백서를 조용히 편집했습니다. 그들은 "GPT-4.5가 프론티어 AI 모델이 아니다"라는 라인을 제거했다. 여기에서는 여전히 원래 백서에 액세스 할 수 있습니다. 아래는 원본 기사입니다.

목요일에 Openai는 코드 이름 Orion이 진행되는 많은 기대 AI 모델 인 GPT-4.5의 커튼을 뒤로 당겼습니다. Openai 의이 최신 거대는 전례없는 양의 컴퓨팅 능력 및 데이터로 교육을 받았으며 전임자와 구별됩니다.

인상적인 규모에도 불구하고 Openai의 백서는 처음에 GPT-4.5를 프론티어 모델로 간주하지 않았다고 말했습니다. 그러나 그 진술은 이후에 제거되어 모델의 진정한 잠재력에 대해 궁금해하게됩니다.

목요일부터 OpenAi의 프리미엄 $ 200에서 1 개월 동안 서비스 인 Chatgpt Pro의 가입자는 연구 미리보기의 일환으로 GPT-4.5의 첫 맛을 얻을 것입니다. OpenAI 대변인에 따르면 OpenAI의 유료 API 계층의 개발자는 오늘 GPT-4.5를 사용하기 시작할 수있는 반면, 다음 주에 ChatGpt Plus 및 ChatGpt 팀 구독을 가진 사람들은 다음 주 언젠가 액세스 할 것으로 예상됩니다.

기술 세계는 오리온에 대해 윙윙 거리고 있으며, 전통적인 AI 훈련 방법이 여전히 물을 담고 있는지 여부를 테스트했습니다. GPT-4.5는 전임자와 동일한 플레이 북을 따르며, 미리 훈련이라는 감독되지 않은 학습 단계에서 컴퓨팅 능력과 데이터의 대규모 증가에 의존합니다.

과거에는 스케일링을 통해 수학, 작문 및 코딩과 같은 다양한 영역에서 상당한 성능이 도약했습니다. Openai는 GPT-4.5의 규모가 "더 깊은 세계 지식"과 "높은 감성 지능"을 부여했다고 주장합니다. 그러나 스케일링으로 인한 수익이 줄어들 수 있다는 힌트가 있습니다. 여러 AI 벤치 마크에서 GPT-4.5는 DeepSeek, Anthropic 및 OpenAi 자체와 같은 회사의 새로운 추론 모델보다 뒤떨어집니다.

또한 GPT-4.5를 실행하면 가격이 무거운 가격표가 제공됩니다. Openai는 너무 비싸서 장기적으로 API를 통해 사용할 수 있는지 고려하고 있다고 인정합니다. 개발자는 백만 입력 토큰마다 75 달러, 백만 출력 토큰마다 150 달러를 지불 할 것입니다. 이는 저렴한 GPT-4O와는 대조적으로 백만 달러당 2.50 달러, 출력 토큰 당 100 만 달러의 비용이 듭니다.

Openai는 블로그 게시물에서 "우리는 GPT -4.5를 연구 미리보기로 공유하고있다"고 블로그 게시물에서 공유했다. "우리는 여전히 잠재력을 최대한 활용하고 있으며 사람들이 어떻게 예상치 못한 방식으로 그것을 사용할 것인지를보고 기쁘게 생각합니다."

혼합 성능

Openai는 GPT-4.5가 대부분의 API와 ChatGpt를 운전하는 작업자 모델 인 GPT-4O를 대체하기위한 것이 아니라는 것이 분명합니다. GPT-4.5는 파일 및 이미지 업로드를 처리하고 chatgpt의 캔버스 도구를 사용할 수 있지만 현재 Chatgpt의 현실적인 양방향 음성 모드와 같은 기능을 지원하지 않습니다.

밝은면에서 GPT-4.5는 OpenAI의 SimpleQA 벤치 마크에서 GPT-4O 및 기타 많은 모델을 능가하며, 이는 AI 모델을 간단하고 사실적인 질문에 대해 테스트합니다. Openai는 또한 GPT-4.5가 대부분의 모델보다 덜 빈번하게 환각한다고 주장하며, 이론적으로 정보를 제작할 가능성이 줄어 듭니다.

흥미롭게도 OpenAi는 단순한 QA 결과에 최고 성능의 추론 모델 중 하나 인 Deep Research를 포함하지 않았습니다. Openai 대변인은 TechCrunch 에게이 벤치 마크에서 Deep Research의 성과를 공개적으로보고하지 않았으며이를 관련 비교로 생각하지 않는다고 말했습니다. 그러나 다른 벤치 마크에 대한 OpenAi의 깊은 연구와 유사하게 수행되는 Perplexity의 딥 리서치 모델은 실제로이 사실 정확도 테스트에서 GPT-4.5를 능가합니다.

SimpleQA 벤치 마크.이 이미지 크레딧 : OpenAi
SWE-Bench Verified Benchmark의 코딩 문제의 하위 집합에서 GPT-4.5는 GPT-4O 및 O3-MINI와 유사하게 수행하지만 OpenAi의 깊은 연구 및 Anthropic의 Claude 3.7 Sonnet에 미치지 못합니다. 또 다른 코딩 테스트에서 AI 모델의 전체 소프트웨어 기능을 개발하는 능력을 측정하는 OpenAi의 SWE-Lancer 벤치 마크는 GPT-4O와 O3-MINI를 능가하지만 깊은 연구를 능가하지 않습니다.

OpenAi의 SWE-Bench 확인 벤치 마크. 이미지 크레딧 : OpenAi
OpenAi의 SWE-Lancer Diamond Benchmark. Image Credits : OpenAi
GPT-4.5는 AIME 및 GPQA와 같은 학업 벤치 마크에 대한 O3-MINI, DeepSeek 's R1 및 Claude 3.7 Sonnet과 같은 주요 AI 추론 모델의 성능과 일치하지 않지만 동일한 테스트에서 비 합리적 인 모델에 대해 자체적으로 보유하고 있습니다. 이것은 GPT-4.5가 수학 및 과학 관련 작업에서 탁월하다는 것을 시사합니다.

OpenAi는 또한 GPT-4.5가 벤치 마크가 인간의 의도를 이해하는 것과 같이 잘 캡처하지 않는 영역의 다른 모델보다 질적으로 우수하다는 것을 자랑합니다. 그들은 GPT-4.5가 더 따뜻하고 자연스러운 톤으로 반응하며 글쓰기와 디자인과 같은 창의적인 작업에서 잘 수행한다고 주장합니다.

비공식 테스트에서 OpenAI는 GPT-4.5와 다른 두 가지 모델 인 GPT-4O와 O3-MINI에게 SVG 형식의 유니콘을 만들도록 요청했습니다. GPT-4.5만이 유니콘과 비슷한 것을 생산할 수있었습니다.

왼쪽 : GPT-4.5, 중간 : GPT-4O, 오른쪽 : O3-MINI.IMAGE 크레딧 : OpenAi
다른 테스트에서 OpenAi는 GPT-4.5와 다른 모델이 프롬프트에 응답하라는 메시지를 표시했습니다. "테스트에 실패한 후 힘든 시간을 거칩니다." GPT-4O와 O3-MINI는 유용한 정보를 제공했지만 GPT-4.5의 반응이 가장 사회적으로 적절했습니다.

Openai는 "우리는이 릴리스를 통해 GPT-4.5의 기능에 대한보다 완전한 그림을 얻을 수 있기를 기대합니다."Openai는 블로그 게시물에 다음과 같이 썼습니다.

GPT-4.5의 감정 지능 행동. 이미지 크레딧 : OpenAi
스케일링 법률 도전

Openai는 GPT -4.5가 "감독되지 않은 학습에서 가능한 것의 국경에있다"고 주장했다. 그러나 그 한계는 사전 훈련의 소위 스케일링 법칙이 그들의 한계에 도달 할 수 있다는 전문가들 사이의 의심이 커지는 것을 뒷받침하는 것으로 보인다.

Openai의 공동 창립자이자 전 최고 과학자 인 Ilya Sutskever는 12 월에 "우리는 피크 데이터를 달성했으며"우리는 그것이 의심 할 여지없이 끝날 것입니다. "라고 말했습니다. 그의 의견은 11 월에 AI 투자자, 설립자 및 연구원이 TechCrunch의 연구원이 공유 한 우려를 반영했습니다.

이러한 과제에 대한 응답으로 OpenAI를 포함한 업계는 추론 모델로 바뀌었고, 이는 작업을 수행하는 데 시간이 더 걸리지 만보다 일관된 결과를 제공합니다. AI Labs는 추론 모델에 더 많은 시간과 컴퓨팅 능력을 "생각"할 수 있도록함으로써 모델 기능을 크게 향상시킬 수 있다고 생각합니다.

OpenAI는 올해 말 GPT-5부터 시작하여 GPT 시리즈를 "O"추론 시리즈와 합병 할 계획입니다. 높은 교육 비용, 지연 및 충족되지 않은 내부 기대에도 불구하고 GPT-4.5는 AI 벤치 마크 크라운을 자체적으로 주장하지 않을 수 있습니다. 그러나 Openai는 그것을 훨씬 더 강력한 것을 향한 중요한 단계로 볼 수 있습니다.

관련 기사
OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI DeepSeek AI Challenges ChatGPT and Shapes the Future of AI The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
의견 (50)
0/200
GregoryBaker
GregoryBaker 2025년 4월 10일 오전 12시 0분 0초 GMT

GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.

NicholasSanchez
NicholasSanchez 2025년 4월 10일 오전 12시 0분 0초 GMT

GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。

JasonJohnson
JasonJohnson 2025년 4월 10일 오전 12시 0분 0초 GMT

GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.

JasonAnderson
JasonAnderson 2025년 4월 10일 오전 12시 0분 0초 GMT

GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.

AvaHill
AvaHill 2025년 4월 10일 오전 12시 0분 0초 GMT

GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.

KennethMartin
KennethMartin 2025년 4월 10일 오전 12시 0분 0초 GMT

GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!

위로 돌아갑니다
OR