Запуск GPT-5 столкнулся с проблемами на фоне препятствий в реализации от OpenAI

Обновлено в пятницу, 8 августа 2025 года, в 17:21 по восточному времени: Вскоре после публикации этой статьи соучредитель и генеральный директор OpenAI Сэм Альтман подтвердил, что компания восстановит доступ к GPT-4o и другим предыдущим моделям для избранных пользователей, признав, что запуск GPT-5 прошел "более неровно, чем мы надеялись".
Мягко выражаясь, долгожданный запуск новой модели OpenAI, GPT-5, начался неудачно.
Даже если закрыть глаза на ошибки в графиках и сбои в голосовых демонстрациях с вчерашней презентации в прямом эфире (где представили четыре различные модели, а также режим «Размышления» для трех из них), многочисленные пользовательские отчеты с момента выпуска показывают, что GPT-5 испытывает трудности с относительно простыми задачами, которые более ранние модели OpenAI — и системы конкурентов из других AI-лабораторий — решают корректно.
Например, специалист по данным Колин Фрейзер поделился скриншотами, где GPT-5 неправильно справляется с математическим доказательством — а именно, равняется ли 8,(8) повторяющаяся 9 (нет, не равняется).
Вау, я просто баловался, но оно действительно глупое pic.twitter.com/ao51nOH0Ui
— Колин Фрейзер (@colin_fraser) 8 августа 2025 г.
Она также не справилась с простым арифметическим уравнением 5.9 = x + 5.11, задачей, которую многие ученики начальных классов могут решить.
Это вызывает беспокойство. https://t.co/PUbeCSgtRV
— Бенджамин Де Кракер (@BenjaminDEKR) 8 августа 2025 г.
Использование GPT-5 для оценки собственных flawed презентационных графиков OpenAI также не дало полезных или точных ответов.
В. Докажите, что использование LLM-as-a-judge все еще не работает
О. pic.twitter.com/KnCK5Xs9ja
— Кангук Ли (@Kangwook_Lee) 7 августа 2025 г.
Кроме того, она споткнулась на этой более хитрой текстовой задаче (которая, признаюсь, даже мне сначала показалась сложной — хотя AI Grok 4 Илона Маска ответила на нее правильно. Для подсказки: помните, что плитки нельзя разбивать; все 80 должны остаться целыми).
Осторожнее, не порежьтесь об острые границы pic.twitter.com/buJGgJ6baI
— Грег Бёрнем (@GregHBurnham) 8 августа 2025 г.
В моих тестах более старая модель GPT-4o справлялась по крайней мере с одной из этих математических задач более надежно. К сожалению, OpenAI постепенно отказывается от этих более ранних моделей — включая предыдущую модель по умолчанию GPT-4o и продвинутую модель для рассуждений o3 — для пользователей ChatGPT, хотя в ближайшее время они останутся доступны через API для разработчиков.
Производительность в кодинге не соответствует бенчмаркам
Несмотря на то, что внутренние бенчмарки OpenAI и некоторые сторонние тесты показывают GPT-5 как лучшую модель для кодинга, использование в реальных условиях suggests, что недавно обновленный Claude Opus 4.1 от Anthropic часто эффективнее справляется с «one-shot» задачами — предоставляя желаемое приложение или сборку программного обеспечения по запросу пользователя. Смотрите этот пример от разработчика Джастина Сана, опубликованный на X:
Попытка Opus 4.1 с одной попытки создать «3D контактный зоопарк с капибарами» – всего 8 минут.
Это было, честно, довольно безумно: не только капибары намного милее и двигаются, но еще есть индивидуальные уровни привязанности, переключатель дня/ночи, кормление и даже функция скриншота pic.twitter.com/FiKTO3FKK4
— Джастин (@justinsunyt) 7 августа 2025 г.
Более того, отчет от security фирмы SPLX показал, что внутренние меры безопасности OpenAI имели значительные пробелы в таких областях, как бизнес-соответствие и восприимчивость к prompt injection и атакам с обфусцированной логикой.
Хотя и основанные на единичных случаях, ранние отзывы от опытных пользователей AI свидетельствуют о в целом прохладном приеме.
AI-инфлюенсер и бывший сотрудник Google Билавал Сидху провел опрос на X, попросив подписчиков провести «vibe check». При 172 голосах на данный момент преобладающий ответ — «Так себе».
Итак, vibe check по GPT-5
— Билавал Сидху (@bilawalsidhu) 7 августа 2025 г.
Как отметил анонимный аккаунт AI Leaks and News, «Подавляющий консенсус относительно GPT-5 как в X, так и в Reddit AMA, overwhelmingly негативный».
Подавляющий консенсус относительно GPT-5 как в X, так и в Reddit AMA, overwhelmingly негативный.
Большинство пользователей недовольны сломанным селектором моделей и отсутствием доступа у непрофессиональных пользователей к предыдущим моделям.
Каковы ваши первоначальные мысли о GPT-5?
— AI Leaks and News (@AILeaksAndNews) 8 августа 2025 г.
Тибор Блахо, ведущий инженер в AIPRM и известный комментатор по AI на X, составил тщательное резюме проблем с запуском ChatGPT-5. Он отметил, что одна из флагманских функций — автоматический «роутер», выбирающий режим с размышлениями или без в зависимости от сложности запроса — стала главным предметом жалоб, поскольку модель часто по умолчанию использует режим без размышлений для многих пользователей.
Немного грустно, как проходит запуск GPT-5, особенно после долгого ожидания и высоких ожиданий.
– Автоматическое переключение между моделями (роутер) кажется частично сломанным/ненадежным.
– Непонятно, с какой именно моделью вы взаимодействуете (стандартной или mini,…
— Тибор Блахо (@btibor91) 8 августа 2025 г.
Конкуренты готовы воспользоваться моментом
В результате настроения вокруг ChatGPT-5 далеки от единодушно позитивных — что представляет серьезную проблему для OpenAI, поскольку конкуренция обостряется со стороны американских гигантов, таких как Google и Anthropic, и растущего числа бесплатных, открытых и мощных китайских больших языковых моделей, предлагающих возможности, которых многим американским моделям не хватает.
Взгляните на исследовательскую группу Alibaba Qwen, которая сегодня обновила свою высокопроизводительную модель Qwen 3 для поддержки контекста в 1 миллион токенов. Это позволяет пользователям обмениваться почти в четыре раза большим объемом информации за одно взаимодействие по сравнению с тем, что currently предлагает GPT-5.
Поскольку другой крупный релиз OpenAI на этой неделе — новая open-source серия моделей gpt-oss — также получает неоднозначные ранние отзывы, перспективы для лидирующей по пользователям dedicated AI-компании (ChatGPT now насчитывает 700 миллионов еженедельных активных пользователей) uncertain.
Эти настроения находят отклик на рынке прогнозов Polymarket, где пользователи overwhelmingly ставят на то, что у Google, вероятно, будет ведущая AI-модель к концу августа 2025 года.
Другие опытные пользователи, такие как соучредитель и генеральный директор Otherside AI Мэтт Шумер — у которого был ранний доступ к GPT-5 и который опубликовал позитивный обзор — suggested, что мнения могут измениться по мере更多的人 optimize свои рабочие процессы под новую модель:
Многие люди, у которых плохой опыт, используют GPT-5 в агентских оболочках, которые еще не оптимизированы для нее.
С каждым новым релизом модели есть временной лаг между выпуском и моментом, когда компании, интегрирующие модель, действительно заставляют ее хорошо работать.
Агентские компании спешат…
— Мэтт Шумер (@mattshumer_) 8 августа 2025 г.
Хотя для GPT-5 еще рано — и мнения могут значительно измениться по мере того, как больше людей будут тестировать ее на различных задачах — первоначальные признаки suggest, что это не «хоум-ран», какими были предыдущие запуски, такие как GPT-4, GPT-4o или o3. Это тревожный сигнал для компании, которая недавно привлекла очередной раунд финансирования, но остается убыточной из-за высоких расходов на НИОКР.
Связанная статья
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Рекомендации по связанным специальным темам
Комментарии (1)

Обновлено в пятницу, 8 августа 2025 года, в 17:21 по восточному времени: Вскоре после публикации этой статьи соучредитель и генеральный директор OpenAI Сэм Альтман подтвердил, что компания восстановит доступ к GPT-4o и другим предыдущим моделям для избранных пользователей, признав, что запуск GPT-5 прошел "более неровно, чем мы надеялись".
Мягко выражаясь, долгожданный запуск новой модели OpenAI, GPT-5, начался неудачно.
Даже если закрыть глаза на ошибки в графиках и сбои в голосовых демонстрациях с вчерашней презентации в прямом эфире (где представили четыре различные модели, а также режим «Размышления» для трех из них), многочисленные пользовательские отчеты с момента выпуска показывают, что GPT-5 испытывает трудности с относительно простыми задачами, которые более ранние модели OpenAI — и системы конкурентов из других AI-лабораторий — решают корректно.
Например, специалист по данным Колин Фрейзер поделился скриншотами, где GPT-5 неправильно справляется с математическим доказательством — а именно, равняется ли 8,(8) повторяющаяся 9 (нет, не равняется).
Вау, я просто баловался, но оно действительно глупое pic.twitter.com/ao51nOH0Ui
— Колин Фрейзер (@colin_fraser) 8 августа 2025 г.
Она также не справилась с простым арифметическим уравнением 5.9 = x + 5.11, задачей, которую многие ученики начальных классов могут решить.
Это вызывает беспокойство. https://t.co/PUbeCSgtRV
— Бенджамин Де Кракер (@BenjaminDEKR) 8 августа 2025 г.
Использование GPT-5 для оценки собственных flawed презентационных графиков OpenAI также не дало полезных или точных ответов.
В. Докажите, что использование LLM-as-a-judge все еще не работает
— Кангук Ли (@Kangwook_Lee) 7 августа 2025 г.
О. pic.twitter.com/KnCK5Xs9ja
Кроме того, она споткнулась на этой более хитрой текстовой задаче (которая, признаюсь, даже мне сначала показалась сложной — хотя AI Grok 4 Илона Маска ответила на нее правильно. Для подсказки: помните, что плитки нельзя разбивать; все 80 должны остаться целыми).
Осторожнее, не порежьтесь об острые границы pic.twitter.com/buJGgJ6baI
— Грег Бёрнем (@GregHBurnham) 8 августа 2025 г.
В моих тестах более старая модель GPT-4o справлялась по крайней мере с одной из этих математических задач более надежно. К сожалению, OpenAI постепенно отказывается от этих более ранних моделей — включая предыдущую модель по умолчанию GPT-4o и продвинутую модель для рассуждений o3 — для пользователей ChatGPT, хотя в ближайшее время они останутся доступны через API для разработчиков.
Производительность в кодинге не соответствует бенчмаркам
Несмотря на то, что внутренние бенчмарки OpenAI и некоторые сторонние тесты показывают GPT-5 как лучшую модель для кодинга, использование в реальных условиях suggests, что недавно обновленный Claude Opus 4.1 от Anthropic часто эффективнее справляется с «one-shot» задачами — предоставляя желаемое приложение или сборку программного обеспечения по запросу пользователя. Смотрите этот пример от разработчика Джастина Сана, опубликованный на X:
Попытка Opus 4.1 с одной попытки создать «3D контактный зоопарк с капибарами» – всего 8 минут.
— Джастин (@justinsunyt) 7 августа 2025 г.
Это было, честно, довольно безумно: не только капибары намного милее и двигаются, но еще есть индивидуальные уровни привязанности, переключатель дня/ночи, кормление и даже функция скриншота pic.twitter.com/FiKTO3FKK4
Более того, отчет от security фирмы SPLX показал, что внутренние меры безопасности OpenAI имели значительные пробелы в таких областях, как бизнес-соответствие и восприимчивость к prompt injection и атакам с обфусцированной логикой.
Хотя и основанные на единичных случаях, ранние отзывы от опытных пользователей AI свидетельствуют о в целом прохладном приеме.
AI-инфлюенсер и бывший сотрудник Google Билавал Сидху провел опрос на X, попросив подписчиков провести «vibe check». При 172 голосах на данный момент преобладающий ответ — «Так себе».
Итак, vibe check по GPT-5
— Билавал Сидху (@bilawalsidhu) 7 августа 2025 г.
Как отметил анонимный аккаунт AI Leaks and News, «Подавляющий консенсус относительно GPT-5 как в X, так и в Reddit AMA, overwhelmingly негативный».
Подавляющий консенсус относительно GPT-5 как в X, так и в Reddit AMA, overwhelmingly негативный.
— AI Leaks and News (@AILeaksAndNews) 8 августа 2025 г.
Большинство пользователей недовольны сломанным селектором моделей и отсутствием доступа у непрофессиональных пользователей к предыдущим моделям.
Каковы ваши первоначальные мысли о GPT-5?
Тибор Блахо, ведущий инженер в AIPRM и известный комментатор по AI на X, составил тщательное резюме проблем с запуском ChatGPT-5. Он отметил, что одна из флагманских функций — автоматический «роутер», выбирающий режим с размышлениями или без в зависимости от сложности запроса — стала главным предметом жалоб, поскольку модель часто по умолчанию использует режим без размышлений для многих пользователей.
Немного грустно, как проходит запуск GPT-5, особенно после долгого ожидания и высоких ожиданий.
— Тибор Блахо (@btibor91) 8 августа 2025 г.
– Автоматическое переключение между моделями (роутер) кажется частично сломанным/ненадежным.
– Непонятно, с какой именно моделью вы взаимодействуете (стандартной или mini,…
Конкуренты готовы воспользоваться моментом
В результате настроения вокруг ChatGPT-5 далеки от единодушно позитивных — что представляет серьезную проблему для OpenAI, поскольку конкуренция обостряется со стороны американских гигантов, таких как Google и Anthropic, и растущего числа бесплатных, открытых и мощных китайских больших языковых моделей, предлагающих возможности, которых многим американским моделям не хватает.
Взгляните на исследовательскую группу Alibaba Qwen, которая сегодня обновила свою высокопроизводительную модель Qwen 3 для поддержки контекста в 1 миллион токенов. Это позволяет пользователям обмениваться почти в четыре раза большим объемом информации за одно взаимодействие по сравнению с тем, что currently предлагает GPT-5.
Поскольку другой крупный релиз OpenAI на этой неделе — новая open-source серия моделей gpt-oss — также получает неоднозначные ранние отзывы, перспективы для лидирующей по пользователям dedicated AI-компании (ChatGPT now насчитывает 700 миллионов еженедельных активных пользователей) uncertain.
Эти настроения находят отклик на рынке прогнозов Polymarket, где пользователи overwhelmingly ставят на то, что у Google, вероятно, будет ведущая AI-модель к концу августа 2025 года.
Другие опытные пользователи, такие как соучредитель и генеральный директор Otherside AI Мэтт Шумер — у которого был ранний доступ к GPT-5 и который опубликовал позитивный обзор — suggested, что мнения могут измениться по мере更多的人 optimize свои рабочие процессы под новую модель:
Многие люди, у которых плохой опыт, используют GPT-5 в агентских оболочках, которые еще не оптимизированы для нее.
— Мэтт Шумер (@mattshumer_) 8 августа 2025 г.
С каждым новым релизом модели есть временной лаг между выпуском и моментом, когда компании, интегрирующие модель, действительно заставляют ее хорошо работать.
Агентские компании спешат…
Хотя для GPT-5 еще рано — и мнения могут значительно измениться по мере того, как больше людей будут тестировать ее на различных задачах — первоначальные признаки suggest, что это не «хоум-ран», какими были предыдущие запуски, такие как GPT-4, GPT-4o или o3. Это тревожный сигнал для компании, которая недавно привлекла очередной раунд финансирования, но остается убыточной из-за высоких расходов на НИОКР.
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения





Дом






