вариант
Дом
Новости
OpenAI запускает GPT-4.5 'Orion': ее самая большая модель ИИ на сегодняшний день

OpenAI запускает GPT-4.5 'Orion': ее самая большая модель ИИ на сегодняшний день

10 апреля 2025 г.
216

Обновлено в 14:40 PT: всего через несколько часов после запуска GPT-4.5, Openai сделал тихое редактирование в белую бумагу модели искусственного интеллекта. Они удалили линию, заявив, что «GPT-4.5 не является пограничной моделью ИИ». Вы все еще можете получить доступ к оригинальной белой бумаге здесь. Ниже приведена оригинальная статья.

В четверг Openai отступил занавес на GPT-4.5, долгожданную модель ИИ, которая выполняет кодовое имя Orion. Этот последний бегемот от Openai был обучен беспрецедентным объемом вычислительной мощности и данных, отличая его от предшественников.

Несмотря на впечатляющий масштаб, белая бумага Openai изначально заявила, что они не считают GPT-4.5-пограничная модель. Тем не менее, это утверждение с тех пор было удалено, заставив нас задуматься о истинном потенциале модели.

Начиная с четверга, подписчики Catgpt Pro, премиального обслуживания Openai за 200 долларов в месяц, получит первый вкус GPT-4.5 в рамках предварительного просмотра исследования. По словам представителя Open, разработчики на платных уровнях API могут начать использовать GPT-4.5, в то время как те, у кого есть подписка CHATGPT Plus и команда CHATGPT, должны ожидать доступа где-то на следующей неделе.

Мир технологий гудел по Ориону, рассматривая его как проверку того, сохраняют ли традиционные методы обучения искусственного интеллекта воду. GPT-4.5 следует той же игре, что и его предшественники, полагаясь на масштабное увеличение вычислительной мощности и данных на этапе обучения без присмотра, называемого предварительным обучением.

В прошлом масштабирование приводило к значительным скачкам производительности в различных областях, таких как математика, написание и кодирование. Openai утверждает, что размер GPT-4.5 наделена «более глубоким мировым знанием» и «более высоким эмоциональным интеллектом». Тем не менее, есть намеки на то, что возврат от масштабирования может уменьшиться. На нескольких тестах ИИ GPT-4.5 отстает от новых моделей рассуждений от таких компаний, как DeepSeek, Anpropic и даже сама Openai.

Более того, запуск GPT-4.5 поставляется с огромной ценностью. Openai признает, что это настолько дорого, что они рассматривают вопрос о том, будет ли в долгосрочной перспективе держать его через свой API. Разработчики будут платить 75 долларов за каждый миллион входных токенов и 150 долларов США за каждый миллион продуктов, что резко контрастирует с более доступным GPT-4O, который стоит всего 2,50 долл. США за миллион входных токенов и 10 долл. США на токены выпуска.

«Мы делимся GPT -4.5 в качестве предварительного просмотра исследования, чтобы лучше понять его сильные и ограничения», - поделился Openai в сообщении в блоге. «Мы все еще исследуем его потенциал и рады видеть, как люди будут использовать его неожиданным образом».

Смешанная производительность

OpenAI ясно, что GPT-4.5 не предназначен для замены GPT-4O, их модели рабочей лошадки, которая управляет большей частью их API и CHATGPT. В то время как GPT-4.5 может обрабатывать загрузки файлов и изображений и использовать инструмент CATGPT Canvas, он в настоящее время не поддерживает такие функции, как реалистичный двухсторонний голосовой режим CHATGPT.

С другой стороны, GPT-4.5 превосходит GPT-4O и многие другие модели на тесте Simpleqa Openai, который проверяет модели искусственного интеллекта на простых фактических вопросах. OpenAI также утверждает, что GPT-4.5 галлюцинает реже, чем большинство моделей, что теоретически должно сделать его менее вероятностью для изготовления информации.

Интересно, что OpenAI не включала одну из своих лучших моделей рассуждений, Deep Research, в результатах Simpleqa. Представитель OpenAI сказал TechCrunch, что они публично не сообщили о результатах Deep Research по этому эталону и не считают это соответствующим сравнением. Тем не менее, модель глубоких исследований с недоумением, которая работает аналогично глубоким исследованиям OpenAI по другим критериям, фактически охватывает GPT-4.5 в этом тесте фактической точности.

Simpleqa Benchmarks.Image Кредиты: OpenAI
На подмножестве задач кодирования из подтвержденного эталона SWE-Bench GPT-4.5 работает аналогично GPT-4O и O3-Mini, но не соответствует глубоким исследованиям Openai и сонету Anpropic Claude 3.7. На другом тесте на кодирование Swe-Lancer Benchmark, который измеряет способность модели ИИ разрабатывать полные программные функции, GPT-4.5 превосходит как GPT-4O, так и O3-Mini, но не превосходит глубокие исследования.

Openai's Swe-Bench проверенный эталон. Image кредиты: Openai
Swe-Lancer Diamond Lancer.
В то время как GPT-4.5 не совсем соответствует производительности ведущих моделей рассуждений с ИИ, таких как O3-Mini, Deepseek's R1 и Claude 3.7 Sonnet на сложных академических показателях, таких как AIME и GPQA, он противостоит ведущим не ведущих моделях на одних и тех же тестах. Это говорит о том, что GPT-4.5 превосходит в задачах, связанных с математикой и наукой.

OpenAI также может похвастаться тем, что GPT-4.5 качественно превосходит другие модели в областях, которые тесты плохо отражают, такие как понимание человеческих намерений. Они утверждают, что GPT-4.5 реагирует более теплым, более естественным тоном и хорошо выполняет творческие задачи, такие как написание и дизайн.

В неформальном тесте OpenAI попросил GPT-4.5 и две другие модели, GPT-4O и O3-Mini, создать единорога в формате SVG. Только GPT-4.5 удалось создать что-то напоминающее единорога.

Слева: GPT-4.5, Middle: GPT-4O, справа: O3-Mini.Image Кредиты: OpenAI
В другом тесте OpenAI побудил GPT-4.5 и другие модели ответить на подсказку: «Я переживаю трудные времена после провала теста». В то время как GPT-4O и O3-Mini предоставили полезную информацию, ответ GPT-4.5 был наиболее социально подходящим.

«Мы с нетерпением ждем возможности получить более полную картину возможностей GPT-4.5 в этом выпуске,-написал Openai в своем блоге,-потому что мы признаем, что академические контрольные показатели не всегда отражают реальную полезность».

Эмоциональный интеллект GPT-4.5 в действии. Image Кредиты: Openai
Законы масштабирования оспаривали

OpenAI утверждает, что GPT -4.5 находится «на границе того, что возможно в неконтролируемом обучении». Тем не менее, его ограничения, по-видимому, подтверждают растущее подозрение среди экспертов, что так называемые законы масштабирования предварительного обучения могут достигать их пределов.

Илья Саускевер, соучредитель Openai и бывший главный ученый OpenaI, заявила в декабре, что «мы достигли пиковых данных» и что «предварительное обучение, как мы знаем, это, несомненно, закончится». Его комментарии повторили проблемы, разделяемые инвесторами ИИ, основателями и исследователями с TechCrunch в ноябре.

В ответ на эти проблемы отрасль, в том числе OpenAI, превратилась в модели рассуждений, которые занимают больше времени для выполнения задач, но предлагают более последовательные результаты. Разрешивая моделями рассуждений больше времени и вычислительной мощности «продумать» через проблемы, лаборатории ИИ считают, что они могут значительно улучшить возможности модели.

OpenAI планирует в конечном итоге объединить свою серию GPT с его серией «O», начиная с GPT-5 в конце этого года. Несмотря на высокие затраты на обучение, задержки и неудовлетворенные внутренние ожидания, GPT-4.5 может не претендовать на критерию ИИ самостоятельно. Но Openai, вероятно, считает это важным шагом к чему -то гораздо более мощному.

Связанная статья
Некоммерческая организация использует агентов искусственного интеллекта для повышения эффективности сбора средств на благотворительность Некоммерческая организация использует агентов искусственного интеллекта для повышения эффективности сбора средств на благотворительность В то время как крупные технологические корпорации продвигают "агентов" искусственного интеллекта как средства повышения производительности бизнеса, одна некоммерческая организация демонстрирует их пот
Ведущие лаборатории искусственного интеллекта предупреждают, что человечество теряет понимание систем ИИ Ведущие лаборатории искусственного интеллекта предупреждают, что человечество теряет понимание систем ИИ В беспрецедентной демонстрации единства исследователи из OpenAI, Google DeepMind, Anthropic и Meta отложили в сторону конкурентные разногласия, чтобы выступить с коллективным предупреждением об ответс
ChatGPT добавляет интеграцию с Google Drive и Dropbox для доступа к файлам ChatGPT добавляет интеграцию с Google Drive и Dropbox для доступа к файлам ChatGPT повышает продуктивность благодаря новым корпоративным функциямКомпания OpenAI представила две новые мощные функции, превращающие ChatGPT в комплексный инструмент повышения производительности
Комментарии (61)
GeorgeCarter
GeorgeCarter 22 августа 2025 г., 12:01:17 GMT+03:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🤔

BruceWilson
BruceWilson 19 августа 2025 г., 6:01:00 GMT+03:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky edit to the white paper? Shady move, OpenAI. Makes me wonder what else they're hiding. Still, I'm hyped to see what this model can do! 😎

BruceBrown
BruceBrown 11 августа 2025 г., 21:01:05 GMT+03:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows—why hide that it’s not a frontier model? 🤔 Makes me wonder what OpenAI’s cooking behind the scenes!

JeffreyRamirez
JeffreyRamirez 6 августа 2025 г., 22:01:00 GMT+03:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez
RalphPerez 5 августа 2025 г., 18:01:00 GMT+03:00

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

WillPerez
WillPerez 23 июля 2025 г., 7:59:29 GMT+03:00

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?

Вернуться к вершине
OR