Дом
После 4-месячной переработки проекта обнародован состав основной команды GPT Image2 из 13 человек
Недавно GPT Image2 произвела фурор в социальных сетях благодаря своей потрясающе реалистичной генерации изображений. По мере роста популярности проекта в центр внимания оказалась небольшая и малоизвестная команда, стоящая за этим проектом. Согласно имеющейся информации, основная команда состоит всего из 13 человек, которым удалось полностью переписать базовую архитектуру всего за четыре месяца. Хотя руководитель исследований Чэнь Боюань не раскрыл конкретных технических деталей, он описывает эту новую модель как «GPT для визуальной сферы», что свидетельствует о значительном скачке вперед в области универсальных возможностей.
Ключевая фигура команды, Чэнь Боюань , имеет замечательный личный путь. Во время работы над докторской диссертацией он стал пионером таких инновационных подходов, как «Diffusion Forcing», и внес вклад в разработку методов настройки инструкций, которые позже были использованы в Gemini 2.0 от Google. Интересно, что он даже не знал Python, когда впервые присоединился к научному лагерю для старшеклассников. Перейдя в OpenAI, он не только возглавил все обучение модели GPT Image, но и стал ключевым членом команды по генерации видео Sora. В ходе одной из демонстраций он продемонстрировал передовое понимание языка моделью, сгенерировав плакаты с идеально отображенным текстом на китайском, корейском и бенгальском языках.

Помимо рендеринга текста, GPT Image2 достигла новых высот в понимании знаний о мире и выполнении сложных инструкций. Этот модуль, возглавляемый доктором Цзяньфэном Ваном из Китайского университета науки и технологий, решает постоянную проблему в генерации изображений с помощью ИИ — например, то, что старые модели всегда по умолчанию рисовали часы с показанием 10:10. Новая модель точно интерпретирует любое указанное время и сложные пространственные компоновки. Д-р Ван отмечает, что модель эффективно сокращает разрыв между творческим видением пользователя и конечным сгенерированным результатом.
Что касается производительности, Югуан Ян из колледжа Чжуюань при Университете Чжэцзяна продемонстрировал способность инструмента мгновенно преобразовывать объемные научные статьи в высокоточные презентации PowerPoint и инфографику. Эта возможность обусловлена глубокой интеграцией командой мультимодального понимания, архитектуры Mixture of Experts (MoE) и технологии ориентации на длинный контекст.
От оригинального DALL-E до сегодняшнего GPT Image2
Связанная статья
МИИТ просит общественность дать отзывы по 121 отраслевому стандарту, включая Протокол контекста моделей искусственного интеллекта
Министерство промышленности и информационных технологий Китая официально опубликовало уведомление с призывом к общественным отзывам по 121 проекту в области стандартизации промышленности, включая «Требования к безопасности приложений в контексте моде
OpenAI сотрудничает с Министерством обороны США; количество случаев деинсталляции ChatGPT увеличилось на 295%.
Общественный гнев: Военное сотрудничество OpenAI вызывает волну отзывов о необходимости удаления приложенияНедавно ведущая компания в области искусственного интеллекта OpenAI объявила о тесном сотрудничестве с Министерством обороны США, предусматрив
OpenAI запускает функцию «Сайты», положив конец эре «безкодового» программирования благодаря веб-сайтам на базе Word
Компания OpenAI представила Sites — новую функцию для Codex, своего ИИ-решения для разработки программного обеспечения. В настоящее время функция находится в стадии предварительного доступа и доступна
Рекомендации по связанным специальным темам
Комментарии (0)
Недавно
Ключевая фигура команды,

Помимо рендеринга текста,
Что касается производительности, Югуан Ян из колледжа Чжуюань при Университете Чжэцзяна продемонстрировал способность инструмента мгновенно преобразовывать объемные научные статьи в высокоточные презентации PowerPoint и инфографику. Эта возможность обусловлена глубокой интеграцией командой мультимодального понимания, архитектуры Mixture of Experts (MoE) и технологии ориентации на длинный контекст.
От оригинального DALL-E до сегодняшнего
МИИТ просит общественность дать отзывы по 121 отраслевому стандарту, включая Протокол контекста моделей искусственного интеллекта
Министерство промышленности и информационных технологий Китая официально опубликовало уведомление с призывом к общественным отзывам по 121 проекту в области стандартизации промышленности, включая «Требования к безопасности приложений в контексте моде
OpenAI сотрудничает с Министерством обороны США; количество случаев деинсталляции ChatGPT увеличилось на 295%.
Общественный гнев: Военное сотрудничество OpenAI вызывает волну отзывов о необходимости удаления приложенияНедавно ведущая компания в области искусственного интеллекта OpenAI объявила о тесном сотрудничестве с Министерством обороны США, предусматрив
OpenAI запускает функцию «Сайты», положив конец эре «безкодового» программирования благодаря веб-сайтам на базе Word
Компания OpenAI представила Sites — новую функцию для Codex, своего ИИ-решения для разработки программного обеспечения. В настоящее время функция находится в стадии предварительного доступа и доступна











