OpenAI запускает GPT-4.5 'Orion': ее самая большая модель ИИ на сегодняшний день
Обновлено в 14:40 PT: всего через несколько часов после запуска GPT-4.5, Openai сделал тихое редактирование в белую бумагу модели искусственного интеллекта. Они удалили линию, заявив, что «GPT-4.5 не является пограничной моделью ИИ». Вы все еще можете получить доступ к оригинальной белой бумаге здесь. Ниже приведена оригинальная статья.
В четверг Openai отступил занавес на GPT-4.5, долгожданную модель ИИ, которая выполняет кодовое имя Orion. Этот последний бегемот от Openai был обучен беспрецедентным объемом вычислительной мощности и данных, отличая его от предшественников.
Несмотря на впечатляющий масштаб, белая бумага Openai изначально заявила, что они не считают GPT-4.5-пограничная модель. Тем не менее, это утверждение с тех пор было удалено, заставив нас задуматься о истинном потенциале модели.
Начиная с четверга, подписчики Catgpt Pro, премиального обслуживания Openai за 200 долларов в месяц, получит первый вкус GPT-4.5 в рамках предварительного просмотра исследования. По словам представителя Open, разработчики на платных уровнях API могут начать использовать GPT-4.5, в то время как те, у кого есть подписка CHATGPT Plus и команда CHATGPT, должны ожидать доступа где-то на следующей неделе.
Мир технологий гудел по Ориону, рассматривая его как проверку того, сохраняют ли традиционные методы обучения искусственного интеллекта воду. GPT-4.5 следует той же игре, что и его предшественники, полагаясь на масштабное увеличение вычислительной мощности и данных на этапе обучения без присмотра, называемого предварительным обучением.
В прошлом масштабирование приводило к значительным скачкам производительности в различных областях, таких как математика, написание и кодирование. Openai утверждает, что размер GPT-4.5 наделена «более глубоким мировым знанием» и «более высоким эмоциональным интеллектом». Тем не менее, есть намеки на то, что возврат от масштабирования может уменьшиться. На нескольких тестах ИИ GPT-4.5 отстает от новых моделей рассуждений от таких компаний, как DeepSeek, Anpropic и даже сама Openai.
Более того, запуск GPT-4.5 поставляется с огромной ценностью. Openai признает, что это настолько дорого, что они рассматривают вопрос о том, будет ли в долгосрочной перспективе держать его через свой API. Разработчики будут платить 75 долларов за каждый миллион входных токенов и 150 долларов США за каждый миллион продуктов, что резко контрастирует с более доступным GPT-4O, который стоит всего 2,50 долл. США за миллион входных токенов и 10 долл. США на токены выпуска.
«Мы делимся GPT -4.5 в качестве предварительного просмотра исследования, чтобы лучше понять его сильные и ограничения», - поделился Openai в сообщении в блоге. «Мы все еще исследуем его потенциал и рады видеть, как люди будут использовать его неожиданным образом».
Смешанная производительность
OpenAI ясно, что GPT-4.5 не предназначен для замены GPT-4O, их модели рабочей лошадки, которая управляет большей частью их API и CHATGPT. В то время как GPT-4.5 может обрабатывать загрузки файлов и изображений и использовать инструмент CATGPT Canvas, он в настоящее время не поддерживает такие функции, как реалистичный двухсторонний голосовой режим CHATGPT.
С другой стороны, GPT-4.5 превосходит GPT-4O и многие другие модели на тесте Simpleqa Openai, который проверяет модели искусственного интеллекта на простых фактических вопросах. OpenAI также утверждает, что GPT-4.5 галлюцинает реже, чем большинство моделей, что теоретически должно сделать его менее вероятностью для изготовления информации.
Интересно, что OpenAI не включала одну из своих лучших моделей рассуждений, Deep Research, в результатах Simpleqa. Представитель OpenAI сказал TechCrunch, что они публично не сообщили о результатах Deep Research по этому эталону и не считают это соответствующим сравнением. Тем не менее, модель глубоких исследований с недоумением, которая работает аналогично глубоким исследованиям OpenAI по другим критериям, фактически охватывает GPT-4.5 в этом тесте фактической точности.

Simpleqa Benchmarks.Image Кредиты: OpenAI На подмножестве задач кодирования из подтвержденного эталона SWE-Bench GPT-4.5 работает аналогично GPT-4O и O3-Mini, но не соответствует глубоким исследованиям Openai и сонету Anpropic Claude 3.7. На другом тесте на кодирование Swe-Lancer Benchmark, который измеряет способность модели ИИ разрабатывать полные программные функции, GPT-4.5 превосходит как GPT-4O, так и O3-Mini, но не превосходит глубокие исследования.

Openai's Swe-Bench проверенный эталон. Image кредиты: Openai 
Swe-Lancer Diamond Lancer. В то время как GPT-4.5 не совсем соответствует производительности ведущих моделей рассуждений с ИИ, таких как O3-Mini, Deepseek's R1 и Claude 3.7 Sonnet на сложных академических показателях, таких как AIME и GPQA, он противостоит ведущим не ведущих моделях на одних и тех же тестах. Это говорит о том, что GPT-4.5 превосходит в задачах, связанных с математикой и наукой.
OpenAI также может похвастаться тем, что GPT-4.5 качественно превосходит другие модели в областях, которые тесты плохо отражают, такие как понимание человеческих намерений. Они утверждают, что GPT-4.5 реагирует более теплым, более естественным тоном и хорошо выполняет творческие задачи, такие как написание и дизайн.
В неформальном тесте OpenAI попросил GPT-4.5 и две другие модели, GPT-4O и O3-Mini, создать единорога в формате SVG. Только GPT-4.5 удалось создать что-то напоминающее единорога.

Слева: GPT-4.5, Middle: GPT-4O, справа: O3-Mini.Image Кредиты: OpenAI В другом тесте OpenAI побудил GPT-4.5 и другие модели ответить на подсказку: «Я переживаю трудные времена после провала теста». В то время как GPT-4O и O3-Mini предоставили полезную информацию, ответ GPT-4.5 был наиболее социально подходящим.
«Мы с нетерпением ждем возможности получить более полную картину возможностей GPT-4.5 в этом выпуске,-написал Openai в своем блоге,-потому что мы признаем, что академические контрольные показатели не всегда отражают реальную полезность».

Эмоциональный интеллект GPT-4.5 в действии. Image Кредиты: Openai Законы масштабирования оспаривали
OpenAI утверждает, что GPT -4.5 находится «на границе того, что возможно в неконтролируемом обучении». Тем не менее, его ограничения, по-видимому, подтверждают растущее подозрение среди экспертов, что так называемые законы масштабирования предварительного обучения могут достигать их пределов.
Илья Саускевер, соучредитель Openai и бывший главный ученый OpenaI, заявила в декабре, что «мы достигли пиковых данных» и что «предварительное обучение, как мы знаем, это, несомненно, закончится». Его комментарии повторили проблемы, разделяемые инвесторами ИИ, основателями и исследователями с TechCrunch в ноябре.
В ответ на эти проблемы отрасль, в том числе OpenAI, превратилась в модели рассуждений, которые занимают больше времени для выполнения задач, но предлагают более последовательные результаты. Разрешивая моделями рассуждений больше времени и вычислительной мощности «продумать» через проблемы, лаборатории ИИ считают, что они могут значительно улучшить возможности модели.
OpenAI планирует в конечном итоге объединить свою серию GPT с его серией «O», начиная с GPT-5 в конце этого года. Несмотря на высокие затраты на обучение, задержки и неудовлетворенные внутренние ожидания, GPT-4.5 может не претендовать на критерию ИИ самостоятельно. Но Openai, вероятно, считает это важным шагом к чему -то гораздо более мощному.
Связанная статья
OpenAI Enhances AI Model Behind Its Operator Agent
OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied
Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI
The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
Комментарии (50)
GregoryBaker
10 апреля 2025 г., 0:00:00 GMT
GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.
0
NicholasSanchez
10 апреля 2025 г., 0:00:00 GMT
GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。
0
JasonJohnson
10 апреля 2025 г., 0:00:00 GMT
GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.
0
JasonAnderson
10 апреля 2025 г., 0:00:00 GMT
GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.
0
AvaHill
10 апреля 2025 г., 0:00:00 GMT
GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.
0
KennethMartin
10 апреля 2025 г., 0:00:00 GMT
GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!
0
Обновлено в 14:40 PT: всего через несколько часов после запуска GPT-4.5, Openai сделал тихое редактирование в белую бумагу модели искусственного интеллекта. Они удалили линию, заявив, что «GPT-4.5 не является пограничной моделью ИИ». Вы все еще можете получить доступ к оригинальной белой бумаге здесь. Ниже приведена оригинальная статья.
В четверг Openai отступил занавес на GPT-4.5, долгожданную модель ИИ, которая выполняет кодовое имя Orion. Этот последний бегемот от Openai был обучен беспрецедентным объемом вычислительной мощности и данных, отличая его от предшественников.
Несмотря на впечатляющий масштаб, белая бумага Openai изначально заявила, что они не считают GPT-4.5-пограничная модель. Тем не менее, это утверждение с тех пор было удалено, заставив нас задуматься о истинном потенциале модели.
Начиная с четверга, подписчики Catgpt Pro, премиального обслуживания Openai за 200 долларов в месяц, получит первый вкус GPT-4.5 в рамках предварительного просмотра исследования. По словам представителя Open, разработчики на платных уровнях API могут начать использовать GPT-4.5, в то время как те, у кого есть подписка CHATGPT Plus и команда CHATGPT, должны ожидать доступа где-то на следующей неделе.
Мир технологий гудел по Ориону, рассматривая его как проверку того, сохраняют ли традиционные методы обучения искусственного интеллекта воду. GPT-4.5 следует той же игре, что и его предшественники, полагаясь на масштабное увеличение вычислительной мощности и данных на этапе обучения без присмотра, называемого предварительным обучением.
В прошлом масштабирование приводило к значительным скачкам производительности в различных областях, таких как математика, написание и кодирование. Openai утверждает, что размер GPT-4.5 наделена «более глубоким мировым знанием» и «более высоким эмоциональным интеллектом». Тем не менее, есть намеки на то, что возврат от масштабирования может уменьшиться. На нескольких тестах ИИ GPT-4.5 отстает от новых моделей рассуждений от таких компаний, как DeepSeek, Anpropic и даже сама Openai.
Более того, запуск GPT-4.5 поставляется с огромной ценностью. Openai признает, что это настолько дорого, что они рассматривают вопрос о том, будет ли в долгосрочной перспективе держать его через свой API. Разработчики будут платить 75 долларов за каждый миллион входных токенов и 150 долларов США за каждый миллион продуктов, что резко контрастирует с более доступным GPT-4O, который стоит всего 2,50 долл. США за миллион входных токенов и 10 долл. США на токены выпуска.
«Мы делимся GPT -4.5 в качестве предварительного просмотра исследования, чтобы лучше понять его сильные и ограничения», - поделился Openai в сообщении в блоге. «Мы все еще исследуем его потенциал и рады видеть, как люди будут использовать его неожиданным образом».
Смешанная производительность
OpenAI ясно, что GPT-4.5 не предназначен для замены GPT-4O, их модели рабочей лошадки, которая управляет большей частью их API и CHATGPT. В то время как GPT-4.5 может обрабатывать загрузки файлов и изображений и использовать инструмент CATGPT Canvas, он в настоящее время не поддерживает такие функции, как реалистичный двухсторонний голосовой режим CHATGPT.
С другой стороны, GPT-4.5 превосходит GPT-4O и многие другие модели на тесте Simpleqa Openai, который проверяет модели искусственного интеллекта на простых фактических вопросах. OpenAI также утверждает, что GPT-4.5 галлюцинает реже, чем большинство моделей, что теоретически должно сделать его менее вероятностью для изготовления информации.
Интересно, что OpenAI не включала одну из своих лучших моделей рассуждений, Deep Research, в результатах Simpleqa. Представитель OpenAI сказал TechCrunch, что они публично не сообщили о результатах Deep Research по этому эталону и не считают это соответствующим сравнением. Тем не менее, модель глубоких исследований с недоумением, которая работает аналогично глубоким исследованиям OpenAI по другим критериям, фактически охватывает GPT-4.5 в этом тесте фактической точности.
OpenAI также может похвастаться тем, что GPT-4.5 качественно превосходит другие модели в областях, которые тесты плохо отражают, такие как понимание человеческих намерений. Они утверждают, что GPT-4.5 реагирует более теплым, более естественным тоном и хорошо выполняет творческие задачи, такие как написание и дизайн.
В неформальном тесте OpenAI попросил GPT-4.5 и две другие модели, GPT-4O и O3-Mini, создать единорога в формате SVG. Только GPT-4.5 удалось создать что-то напоминающее единорога.
«Мы с нетерпением ждем возможности получить более полную картину возможностей GPT-4.5 в этом выпуске,-написал Openai в своем блоге,-потому что мы признаем, что академические контрольные показатели не всегда отражают реальную полезность».

Эмоциональный интеллект GPT-4.5 в действии. Image Кредиты: Openai Законы масштабирования оспаривали
OpenAI утверждает, что GPT -4.5 находится «на границе того, что возможно в неконтролируемом обучении». Тем не менее, его ограничения, по-видимому, подтверждают растущее подозрение среди экспертов, что так называемые законы масштабирования предварительного обучения могут достигать их пределов.
Илья Саускевер, соучредитель Openai и бывший главный ученый OpenaI, заявила в декабре, что «мы достигли пиковых данных» и что «предварительное обучение, как мы знаем, это, несомненно, закончится». Его комментарии повторили проблемы, разделяемые инвесторами ИИ, основателями и исследователями с TechCrunch в ноябре.
В ответ на эти проблемы отрасль, в том числе OpenAI, превратилась в модели рассуждений, которые занимают больше времени для выполнения задач, но предлагают более последовательные результаты. Разрешивая моделями рассуждений больше времени и вычислительной мощности «продумать» через проблемы, лаборатории ИИ считают, что они могут значительно улучшить возможности модели.
OpenAI планирует в конечном итоге объединить свою серию GPT с его серией «O», начиная с GPT-5 в конце этого года. Несмотря на высокие затраты на обучение, задержки и неудовлетворенные внутренние ожидания, GPT-4.5 может не претендовать на критерию ИИ самостоятельно. Но Openai, вероятно, считает это важным шагом к чему -то гораздо более мощному.




GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.




GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。




GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.




GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.




GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.




GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!












