вариант
Дом
Новости
Модель ChatGPT Images 2.0 отлично справляется с генерацией текста

Модель ChatGPT Images 2.0 отлично справляется с генерацией текста

17 мая 2026 г.
51

Всего пару лет назад отличить изображения, созданные человеком, от сгенерированных ИИ было относительно просто. Тогда, если попросить модель обработки изображений создать меню для мексиканского ресторана, в результате часто получались причудливые, выдуманные блюда, такие как «энчуита», «чурирос», «буррто» или «маргартас».

Сегодня, когда я запрашиваю меню мексиканской кухни у новой модели ChatGPT Images 2.0, она генерирует нечто, что можно сразу использовать в реальном ресторане, и клиенты вряд ли заметят что-то неладное. (Хотя севиче за 13,50 долларов все же может вызвать некоторые вопросы относительно качества рыбы).

Новая модель ChatGPT Images 2.0 на удивление хорошо справляется с генерацией текста

Источник изображения: ChatGPT Images 2.0

Для сравнения, вот результат, который я получил от DALL-E 3 два года назад. (В то время у ChatGPT не было возможностей генерации изображений):

Новая модель ChatGPT Images 2.0 на удивление хорошо справляется с генерацией текста

Источник изображения: Microsoft Designer (DALL-E 3)

Исторически сложилось так, что генераторы изображений на базе ИИ испытывали значительные трудности с орфографией. Во многом это связано с тем, что они обычно полагались на диффузионные модели, которые реконструируют изображения из случайного шума.

«Диффузионные модели [...] реконструируют заданный входной сигнал», — пояснил TechCrunch в 2024 году Асмелаш Тека Хадгу, основатель и генеральный директор Lesan AI. «Мы можем считать текст на изображении очень незначительным компонентом, поэтому генератор изображений уделяет приоритетное внимание изучению визуальных паттернов, которые занимают больше пикселей».

С тех пор исследователи изучают другие подходы к генерации изображений, такие как авторегрессионные модели. Эти модели шаг за шагом предсказывают, как должно выглядеть изображение, работая по принципу, более схожему с большими языковыми моделями (LLM).

К сожалению, OpenAI отказалась отвечать на вопрос во время пресс-брифинга на этой неделе относительно конкретной архитектуры модели, лежащей в основе ChatGPT Images 2.0.

Однако компания уточнила, что новая модель обладает «способностями к мышлению». Это позволяет ей искать информацию в Интернете, создавать несколько изображений по одному запросу и анализировать собственные результаты. Эти функции позволяют Images 2.0 создавать маркетинговые материалы различных форматов, а также многопанельные комиксы.

OpenAI также заявляет, что Images 2.0 лучше справляется с рендерингом нелатинских шрифтов, включая японский, корейский, хинди и бенгальский. Знания модели актуальны до декабря 2025 года, что может повлиять на ее точность при генерации изображений, связанных с самыми свежими событиями.

«Images 2.0 обеспечивает беспрецедентный уровень детализации и точности при создании изображений. Он может не только концептуализировать более сложные сцены, но и эффективно воплощать эту концепцию. Он точно следует инструкциям, сохраняет запрашиваемые детали и отображает мелкодетализированные элементы, которые часто представляют сложность для других моделей генерации изображений — такие как мелкий текст, значки, компоненты пользовательского интерфейса, сложные композиции и тонкие стилистические нюансы — и все это с разрешением до 2K», — отмечает OpenAI в пресс-релизе.

Эти расширенные возможности означают, что генерация изображений не происходит так мгновенно, как при задании текстового вопроса ChatGPT. Однако создание чего-то сложного, например многопанельного комикса, по-прежнему занимает всего несколько минут.

Все пользователи ChatGPT и Codex получат доступ к Images 2.0 со вторника, при этом платные подписчики смогут генерировать более продвинутые результаты. Компания также выпустит API gpt-image-2, цены на который будут зависеть от желаемого качества и разрешения результата.

Связанная статья
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI Грег Брокман рассказывает, как Илон Маск покинул OpenAI В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Рекомендации по связанным специальным темам
Преобразование текста в речь Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения
Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов
xix.ai
Создание комиксов Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии
Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов
xix.ai
Бизнес Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы
Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов
xix.ai
Бизнес Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами
Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов
xix.ai
Производительность Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии
Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью
Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов
xix.ai
Комментарии (0)
0/500
OR