Представлена модель GPT-4.5 от OpenAI: Критическая оценка

Дом

Новости

1 ноября 2025 г.

JonathanJackson

119

ИИ-сообщество всколыхнул недавний анонс GPT-4.5 от OpenAI. После того как он был показан в прямом эфире, главный вопрос остается открытым: является ли он серьезным прорывом или всего лишь тонким обновлением? Наш подробный анализ рассматривает заявления, связанные с GPT-4.5, сравнивая его с предшественниками и конкурентами, чтобы отделить факты от рекламной шумихи.

Ключевые моменты

GPT-4.5 рекламируется как универсальная модель общего назначения с улучшенной предварительной подготовкой.

Первые данные бенчмарков дают неоднозначную картину, показывая отставание GPT-4.5 от некоторых моделей с открытым исходным кодом в определенных задачах.

Стоимость API для GPT-4.5 значительно выше, чем для предыдущих версий.

Возникают вопросы о том, не ставит ли OpenAI во главу угла масштаб, а не подлинные, инновационные улучшения в архитектуре моделей и методологии обучения.

Альтернативы, такие как DeepSeek V3, предлагают сильный вариант с открытым исходным кодом с сопоставимой производительностью и большей эффективностью.

GPT-4.5: обещания против реальности

Первые реакции и вопросы без ответов

Реакция на презентацию GPT-4.5 была смесью восторга и сомнений.

Акцент на том, чтобы модель казалась "более естественной", заставляет задавать вопросы о ее конкретных, измеримых достижениях. Многие задаются вопросом: Уменьшилось ли количество галлюцинаций? Насколько она действительно превосходит GPT-4o в повседневном применении? Эти нерешенные вопросы требуют более глубокого изучения производительности и технических основ модели.

В сфере ИИ ощущается чувство разочарования. Пользователи ищут количественно измеримый прогресс, выходящий за рамки поверхностного естественного разговорного стиля. Реальным мерилом успеха будет его способность справляться со сложными задачами, находить практические решения и выдавать по-настоящему творческие результаты.

В конечном счете, любая модель ИИ оценивается по ее объективной производительности и экономической эффективности. Без значительного прогресса в этих ключевых областях привлекательность "более естественного" взаимодействия может оказаться недостаточной, чтобы оправдать обновление.

Сравнение бенчмарков: Более пристальный взгляд

Официальные данные бенчмарков для GPT-4.5 рисуют несколько скудную картину.

Хотя он демонстрирует прирост в некоторых областях, его производительность заметно отстает от DeepSeek V3, относительно новой модели с открытым исходным кодом. Это удивительно, учитывая огромные ресурсы и опыт OpenAI. Решение сравнивать GPT-4.5 в первую очередь с его прямым предшественником GPT-4o, а не с более широким спектром современных конкурентов, еще больше усиливает скептицизм.

Ниже приводится анализ производительности бенчмарков с выделением ключевых проблемных областей:

Математика (AIME '24): GPT-4.5 достигает точности 36,7 %, что относительно мало по сравнению с другими доступными фундаментальными моделями. Это очень важная способность, так как надежные математические рассуждения необходимы для множества реальных приложений.
Наука (GPQA): Здесь GPT-4.5 показывает более высокие результаты, достигая 71,4 % точности. Это говорит о глубоком понимании научных принципов, хотя и не означает автоматического превосходства в общих способностях.
Кодирование (SWE-Bench Verified): GPT-4.5 набирает 38 %, что указывает на значительную слабость в задачах программирования.

Важно помнить, что эти контрольные показатели дают лишь ограниченное представление о возможностях модели в конкретных, контролируемых сценариях. Для тщательной оценки необходимо провести тестирование в различных реальных приложениях, чтобы точно оценить ее потенциал.

Задача	Точность GPT-4.5	Точность GPT-4o
GPQA (наука)	71.4%	53.6%
AIME '24 (математика)	36.7%	9.3%
SWE-Bench Verified (кодирование)	38%	31%
MMMU (мультимодальный)	74.4%	69.1%

Ценообразование API: Премия за "естественность"?

Стоимость использования API GPT-4.5 заметно выше, чем в предыдущих моделях.

Такая ценовая стратегия поднимает важные вопросы о доступности, особенно для небольших компаний и независимых разработчиков. Является ли воспринимаемое улучшение "естественности" достаточно убедительным, чтобы оправдать существенное повышение цены?

Для большинства ответ, скорее всего, будет отрицательным. Фундаментальная ценность модели ИИ заключается в ее производительности, точности и операционной эффективности. Если GPT-4.5 не сможет обеспечить существенный скачок в этих основных показателях, ее премиальную стоимость станет трудно оправдать. Более доступные альтернативы с открытым исходным кодом, вероятно, получат значительное распространение.

Рассмотрим эталон кодирования Aider: Выполнение его на GPT-4.5 гораздо дороже, чем использование DeepSeek V3. Такой разброс цен создает более высокий барьер для входа и может помешать широкому распространению GPT-4.5 среди разработчиков.

Более того, по некоторым данным, он в сотни раз дороже DeepSeek. Один только этот фактор стоимости может стать для многих решающей причиной отказаться от GPT-4.5 в пользу более экономичных систем.

Модель	Входная цена (за 1 млн токенов)	Выходная цена (за 1 млн токенов)
GPT-4.5	$75.00	$150.00
GPT-4o	$2.50	$10.00

Восхождение альтернатив с открытым исходным кодом: DeepSeek V3

Почему DeepSeek V3 заслуживает внимания

Появление высокопроизводительных моделей с открытым исходным кодом, таких как DeepSeek V3, представляет собой серьезную проблему для лидерства OpenAI на рынке.

DeepSeek V3 предлагает привлекательный пакет конкурентоспособной производительности, операционной эффективности и прозрачности модели. По имеющимся данным, она стоит в сотни раз меньше, чем GPT-4.5.

Вот некоторые из его основных преимуществ:

Конкурентная производительность: Как показывают контрольные показатели, DeepSeek V3 конкурирует с GPT-4.5, а иногда и превосходит его в таких ключевых областях, как математика и кодирование.
Экономическая эффективность: Благодаря открытому исходному коду DeepSeek V3 не требует затрат на API, что делает его гораздо более доступным для развертывания. Это открывает возможности продвинутого ИИ для гораздо более широкой аудитории.
Прозрачность и настройка: Модели с открытым исходным кодом обеспечивают большую прозрачность их работы и допускают широкую кастомизацию. Разработчики могут адаптировать модель для конкретных целей и участвовать в ее развитии.

Стоит отметить, что компания DeepSeek недавно провела "неделю открытого кода", выпустив несколько репозиториев, посвященных эффективности и оптимизации GPU. Именно такие практические инновации нужны многим компаниям для масштабирования своей деятельности, а не просто усовершенствование разговорного стиля модели.

GPT-4.5: взвешивание плюсов и минусов

Плюсы

Потенциал для более естественного и плавного языкового взаимодействия.

Возможность специализированного продвижения в определенных категориях задач.

Постоянная поддержка разработки и обслуживания со стороны OpenAI.

Высокий уровень владения языком.

Конс

Непомерно высокая стоимость API по сравнению с конкурирующими моделями.

Производительность, которая отстает от ведущих альтернатив с открытым исходным кодом в нескольких бенчмарках.

Отсутствие ясности в отношении внутренней архитектуры модели и данных для обучения.

Демонстрируемая слабость в математических задачах и задачах кодирования.

Цена в 12-30 раз выше, чем у GPT-4o.

Часто задаваемые вопросы

Является ли GPT-4.5 значительным обновлением по сравнению с GPT-4o?

Первые результаты тестирования противоречивы. Он демонстрирует прогресс в некоторых дисциплинах, но не дотягивает до других моделей с открытым исходным кодом в решении конкретных задач. Чтобы окончательно оценить его ценность, требуется более полная оценка в реальных условиях.

Стоит ли GPT-4.5 высокой стоимости API?

Ответ зависит от ваших конкретных требований и финансовых ограничений. Если вам нужна производительность высшего уровня для специфических, критически важных приложений, возможно, стоит рассмотреть этот вариант. Однако для большинства пользователей высокую цену трудно оправдать, особенно если учесть возможности свободно распространяемых вариантов с открытым исходным кодом.

В чем заключаются ключевые преимущества моделей ИИ с открытым исходным кодом, таких как DeepSeek V3?

Модели с открытым исходным кодом обеспечивают конкурентоспособную производительность, исключительную экономическую эффективность, большую прозрачность работы и гибкость в настройке. Они делают мощные инструменты ИИ доступными для всех и поощряют инновации, движимые сообществом.

Связанные вопросы

Каково будущее разработки моделей ИИ?

Траектория развития ИИ, скорее всего, будет включать в себя синергию между собственными разработками и разработками с открытым исходным кодом. Крупные технологические компании, такие как OpenAI, будут и дальше продвигать современные технологии с помощью крупномасштабных моделей, а сообщество разработчиков с открытым исходным кодом будет играть решающую роль в демократизации доступа к ИИ и стимулировании инноваций путем совместной разработки и адаптации. Важно признать, что GPT-4.5 имеет заметные недостатки, и OpenAI необходимо решить несколько проблем, чтобы эффективно конкурировать с другими моделями с открытым исходным кодом.

Связанная статья

Компания Trace привлекла 3 миллиона долларов для преодоления препятствий на пути внедрения интеллектуальных агентов в корпоративной среде. Несмотря на свой потенциал, искусственные интеллектуальные агенты испытывают трудности с получением распространения в корпоративной среде. Одна из новых стартап-компаний считает, что основная проблема заключается в отсутствии контекста.Компания Trac

На конференции Google I/O 2026 представлена функция голосового управления почтовым ящиком Gmail Google продолжает внедрять искусственный интеллект в ваш почтовый ящик. На конференции разработчиков IO 2026, состоявшейся во вторник, компания расширила функционал «AI Inbox» в Gmail за счет диалогов

iFlytek представляет свои первые очки с искусственным интеллектом, оснащенные помощником GlassClaw, по цене 4299 юаней. По мере того как крупные модели искусственного интеллекта все чаще используются в периферийном оборудовании, рынок умных носимых устройств получил нового значимого участника. 28 мая компания iFLYTEK официально представила свои «Очки iFLYTEK AI» на вы

Рекомендации по связанным специальным темам

код

Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях

Откройте для себя 20 лучших рецензентов кода на базе ИИ 2026 года на XIX.AI. В нашем тщательно составленном списке представлены высокооцененные, революционные инструменты для автоматизации проверки соответствия стандартам чистого кода и рефакторинга файлов в устаревших репозиториях. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Получите преимущество ИИ уже сегодня.

10 инструментов

xix.ai

Преобразование текста в речь

Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов

xix.ai

Создание комиксов

Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов

xix.ai

Бизнес

Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов

xix.ai

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

Комментарии (5)

0/500

Пожалуйста, войдите в систему

GregoryRamirez

28 апреля 2026 г., 19:00:58 GMT+03:00

Die Diskussion um GPT-4.5 erinnert mich an die ewige Frage: Ist es wirklich ein Durchbruch oder nur ein cleveres Marketing-Upgrade? 🤔 Die Geschwindigkeitssteigerung klingt praktisch, aber ich frage mich, ob die Kosten für Endnutzer wieder steigen werden. Die KI-Community scheint gespalten – einige feiern es, andere sehen nur inkrementelle Fortschritte. Spannend wird sein, wie sich das auf den Wettbewerb mit anderen Modellen auswirkt.

KennethRoberts

16 апреля 2026 г., 7:02:09 GMT+03:00

Die Diskussion um GPT-4.5 ist echt spannend. Ich frage mich, ob die Verbesserungen wirklich so bahnbrechend sind oder ob es eher um Marketing geht. Die KI-Entwicklung wird immer schneller, aber die Kosten und der Energieverbrauch sind auch ein Thema, über das man reden sollte. 🤔

RichardJohnson

2 марта 2026 г., 3:00:14 GMT+03:00

이번 GPT-4.5 발표를 보면서 AI 경쟁이 점점 더 치열해지고 있다는 생각이 들어요. 🤔 다른 기업들도 곧 비슷한 모델을 내놓지 않을까? 기술 발전 속도가 너무 빨라서 따라가기 벅차네요. 개인정보 보호 문제는 어떻게 해결할지 궁금해지는데...

FredLee

13 февраля 2026 г., 7:00:43 GMT+03:00

Wait, another model drop already? 🤔 The speed is insane but I'm low-key worried about how smaller AI labs can keep up. Also, did they mention anything about training costs this time? The energy consumption talk is always glossed over...

FredBrown

3 декабря 2025 г., 3:30:34 GMT+03:00

Est-ce que GPT-4.5 est vraiment une révolution ou juste un coup marketing? 🤔 J’ai l’impression qu’OpenAI accélère la cadence pour devancer la concurrence, mais est-ce au détriment de la stabilité ? En tout cas, ça donne envie de tester !

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан