Запуск GPT-5 столкнулся с проблемами на фоне препятствий в реализации от OpenAI

Дом

Новости

26 ноября 2025 г.

ChristopherThomas

# openai # gpt-5 # LLMs # nlp

Запуск GPT-5 столкнулся с проблемами на фоне препятствий в реализации от OpenAI

Обновлено в пятницу, 8 августа 2025 года, в 17:21 по восточному времени: Вскоре после публикации этой статьи соучредитель и генеральный директор OpenAI Сэм Альтман подтвердил, что компания восстановит доступ к GPT-4o и другим предыдущим моделям для избранных пользователей, признав, что запуск GPT-5 прошел "более неровно, чем мы надеялись".

Мягко выражаясь, долгожданный запуск новой модели OpenAI, GPT-5, начался неудачно.

Даже если закрыть глаза на ошибки в графиках и сбои в голосовых демонстрациях с вчерашней презентации в прямом эфире (где представили четыре различные модели, а также режим «Размышления» для трех из них), многочисленные пользовательские отчеты с момента выпуска показывают, что GPT-5 испытывает трудности с относительно простыми задачами, которые более ранние модели OpenAI — и системы конкурентов из других AI-лабораторий — решают корректно.

Например, специалист по данным Колин Фрейзер поделился скриншотами, где GPT-5 неправильно справляется с математическим доказательством — а именно, равняется ли 8,(8) повторяющаяся 9 (нет, не равняется).

Вау, я просто баловался, но оно действительно глупое pic.twitter.com/ao51nOH0Ui
— Колин Фрейзер (@colin_fraser) 8 августа 2025 г.

Она также не справилась с простым арифметическим уравнением 5.9 = x + 5.11, задачей, которую многие ученики начальных классов могут решить.

Это вызывает беспокойство. https://t.co/PUbeCSgtRV
— Бенджамин Де Кракер (@BenjaminDEKR) 8 августа 2025 г.

Использование GPT-5 для оценки собственных flawed презентационных графиков OpenAI также не дало полезных или точных ответов.

В. Докажите, что использование LLM-as-a-judge все еще не работает

О. pic.twitter.com/KnCK5Xs9ja
— Кангук Ли (@Kangwook_Lee) 7 августа 2025 г.

Кроме того, она споткнулась на этой более хитрой текстовой задаче (которая, признаюсь, даже мне сначала показалась сложной — хотя AI Grok 4 Илона Маска ответила на нее правильно. Для подсказки: помните, что плитки нельзя разбивать; все 80 должны остаться целыми).

Осторожнее, не порежьтесь об острые границы pic.twitter.com/buJGgJ6baI
— Грег Бёрнем (@GregHBurnham) 8 августа 2025 г.

В моих тестах более старая модель GPT-4o справлялась по крайней мере с одной из этих математических задач более надежно. К сожалению, OpenAI постепенно отказывается от этих более ранних моделей — включая предыдущую модель по умолчанию GPT-4o и продвинутую модель для рассуждений o3 — для пользователей ChatGPT, хотя в ближайшее время они останутся доступны через API для разработчиков.

Производительность в кодинге не соответствует бенчмаркам

Несмотря на то, что внутренние бенчмарки OpenAI и некоторые сторонние тесты показывают GPT-5 как лучшую модель для кодинга, использование в реальных условиях suggests, что недавно обновленный Claude Opus 4.1 от Anthropic часто эффективнее справляется с «one-shot» задачами — предоставляя желаемое приложение или сборку программного обеспечения по запросу пользователя. Смотрите этот пример от разработчика Джастина Сана, опубликованный на X:

Попытка Opus 4.1 с одной попытки создать «3D контактный зоопарк с капибарами» – всего 8 минут.

Это было, честно, довольно безумно: не только капибары намного милее и двигаются, но еще есть индивидуальные уровни привязанности, переключатель дня/ночи, кормление и даже функция скриншота pic.twitter.com/FiKTO3FKK4
— Джастин (@justinsunyt) 7 августа 2025 г.

Более того, отчет от security фирмы SPLX показал, что внутренние меры безопасности OpenAI имели значительные пробелы в таких областях, как бизнес-соответствие и восприимчивость к prompt injection и атакам с обфусцированной логикой.

Хотя и основанные на единичных случаях, ранние отзывы от опытных пользователей AI свидетельствуют о в целом прохладном приеме.

AI-инфлюенсер и бывший сотрудник Google Билавал Сидху провел опрос на X, попросив подписчиков провести «vibe check». При 172 голосах на данный момент преобладающий ответ — «Так себе».

Итак, vibe check по GPT-5
— Билавал Сидху (@bilawalsidhu) 7 августа 2025 г.

Как отметил анонимный аккаунт AI Leaks and News, «Подавляющий консенсус относительно GPT-5 как в X, так и в Reddit AMA, overwhelmingly негативный».

Подавляющий консенсус относительно GPT-5 как в X, так и в Reddit AMA, overwhelmingly негативный.

Большинство пользователей недовольны сломанным селектором моделей и отсутствием доступа у непрофессиональных пользователей к предыдущим моделям.

Каковы ваши первоначальные мысли о GPT-5?
— AI Leaks and News (@AILeaksAndNews) 8 августа 2025 г.

Тибор Блахо, ведущий инженер в AIPRM и известный комментатор по AI на X, составил тщательное резюме проблем с запуском ChatGPT-5. Он отметил, что одна из флагманских функций — автоматический «роутер», выбирающий режим с размышлениями или без в зависимости от сложности запроса — стала главным предметом жалоб, поскольку модель часто по умолчанию использует режим без размышлений для многих пользователей.

Немного грустно, как проходит запуск GPT-5, особенно после долгого ожидания и высоких ожиданий.

– Автоматическое переключение между моделями (роутер) кажется частично сломанным/ненадежным.

– Непонятно, с какой именно моделью вы взаимодействуете (стандартной или mini,…
— Тибор Блахо (@btibor91) 8 августа 2025 г.

Конкуренты готовы воспользоваться моментом

В результате настроения вокруг ChatGPT-5 далеки от единодушно позитивных — что представляет серьезную проблему для OpenAI, поскольку конкуренция обостряется со стороны американских гигантов, таких как Google и Anthropic, и растущего числа бесплатных, открытых и мощных китайских больших языковых моделей, предлагающих возможности, которых многим американским моделям не хватает.

Взгляните на исследовательскую группу Alibaba Qwen, которая сегодня обновила свою высокопроизводительную модель Qwen 3 для поддержки контекста в 1 миллион токенов. Это позволяет пользователям обмениваться почти в четыре раза большим объемом информации за одно взаимодействие по сравнению с тем, что currently предлагает GPT-5.

Поскольку другой крупный релиз OpenAI на этой неделе — новая open-source серия моделей gpt-oss — также получает неоднозначные ранние отзывы, перспективы для лидирующей по пользователям dedicated AI-компании (ChatGPT now насчитывает 700 миллионов еженедельных активных пользователей) uncertain.

Эти настроения находят отклик на рынке прогнозов Polymarket, где пользователи overwhelmingly ставят на то, что у Google, вероятно, будет ведущая AI-модель к концу августа 2025 года.

Другие опытные пользователи, такие как соучредитель и генеральный директор Otherside AI Мэтт Шумер — у которого был ранний доступ к GPT-5 и который опубликовал позитивный обзор — suggested, что мнения могут измениться по мере更多的人 optimize свои рабочие процессы под новую модель:

Многие люди, у которых плохой опыт, используют GPT-5 в агентских оболочках, которые еще не оптимизированы для нее.

С каждым новым релизом модели есть временной лаг между выпуском и моментом, когда компании, интегрирующие модель, действительно заставляют ее хорошо работать.

Агентские компании спешат…
— Мэтт Шумер (@mattshumer_) 8 августа 2025 г.

Хотя для GPT-5 еще рано — и мнения могут значительно измениться по мере того, как больше людей будут тестировать ее на различных задачах — первоначальные признаки suggest, что это не «хоум-ран», какими были предыдущие запуски, такие как GPT-4, GPT-4o или o3. Это тревожный сигнал для компании, которая недавно привлекла очередной раунд финансирования, но остается убыточной из-за высоких расходов на НИОКР.

Связанная статья

Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы

OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых

Грег Брокман рассказывает, как Илон Маск покинул OpenAI В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения

Рекомендации по связанным специальным темам

Создание комиксов

Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов

xix.ai

Бизнес

Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов

xix.ai

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Образование и обучение

Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов

xix.ai

Комментарии (1)

0/500

Пожалуйста, войдите в систему

DanielAllen

1 июня 2026 г., 13:00:19 GMT+03:00

Honestly, I'm not surprised. OpenAI rushed GPT-4o and now they're backtracking? Classic move 😅. Hope they get it right eventually, but I'm sticking with Claude for now.

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан