вариант
Дом
Новости
Meta представляет Llama 4 с длинным контекстом и моделями Maverick, 2T Parameter Bhemoth скоро появится!

Meta представляет Llama 4 с длинным контекстом и моделями Maverick, 2T Parameter Bhemoth скоро появится!

16 апреля 2025 г.
223

В январе 2025 года мир ИИ был потрясен, когда относительно неизвестный китайский стартап в области ИИ, DeepSeek, бросил вызов с их революционной моделью логического вывода с открытым исходным кодом, DeepSeek R1. Эта модель не только превзошла таких гигантов, как Meta, но и сделала это при значительно меньших затратах — по слухам, всего за несколько миллионов долларов. Это тот бюджет, который Meta могла бы потратить на пару своих лидеров команд ИИ! Эта новость вызвала у Meta некоторую панику, особенно потому, что их последняя модель Llama, версия 3.3, выпущенная всего месяц назад, уже выглядела немного устаревшей.

Сегодня основатель и генеральный директор Meta, Марк Цукерберг, объявил в Instagram о запуске новой серии Llama 4. Эта серия включает Llama 4 Maverick с 400 миллиардами параметров и Llama 4 Scout с 109 миллиардами параметров, оба доступны для разработчиков для загрузки и немедленного экспериментирования на llama.com и Hugging Face. Также представлен предварительный обзор колоссальной модели с 2 триллионами параметров, Llama 4 Behemoth, которая все еще находится в стадии обучения, и дата выпуска пока не объявлена.

Мультимодальные и длинноконтекстные возможности

Одной из выдающихся особенностей этих новых моделей является их мультимодальность. Они не только работают с текстом, но также могут обрабатывать видео и изображения. Кроме того, они имеют невероятно длинные контекстные окна — 1 миллион токенов для Maverick и впечатляющие 10 миллионов для Scout. Для сравнения, это как обработка до 1500 и 15 000 страниц текста за один раз! Представьте возможности для таких областей, как медицина, наука или литература, где нужно обрабатывать и генерировать огромные объемы информации.

Архитектура смеси экспертов

Все три модели Llama 4 используют архитектуру "смеси экспертов" (MoE), технику, которая набирает популярность благодаря таким компаниям, как OpenAI и Mistral. Этот подход объединяет несколько меньших, специализированных моделей в одну большую и более эффективную модель. Каждая модель Llama 4 состоит из 128 различных экспертов, что означает, что только необходимый эксперт и общий эксперт обрабатывают каждый токен, делая модели более экономичными и быстрыми в работе. Meta утверждает, что Llama 4 Maverick можно запускать на одном хосте Nvidia H100 DGX, что упрощает развертывание.

Экономичность и доступность

Meta стремится сделать эти модели доступными. И Scout, и Maverick доступны для самостоятельного хостинга, и они даже поделились привлекательными оценками затрат. Например, стоимость вывода для Llama 4 Maverick составляет от $0.19 до $0.49 за миллион токенов, что является выгодной сделкой по сравнению с другими проприетарными моделями, такими как GPT-4o. А если вы хотите использовать эти модели через облачного провайдера, Groq уже предложил конкурентоспособные цены.

Улучшенные способности к логическому выводу и MetaP

Эти модели созданы с учетом логического вывода, программирования и решения задач. Meta использовала некоторые умные техники во время обучения для усиления этих возможностей, такие как удаление простых запросов и использование непрерывного обучения с подкреплением с постепенно усложняющимися запросами. Они также представили MetaP, новую технику, которая позволяет устанавливать гиперпараметры на одной модели и применять их к другим, экономя время и деньги. Это кардинально меняет ситуацию, особенно для обучения таких монстров, как Behemoth, который использует 32 тысячи графических процессоров и обрабатывает более 30 триллионов токенов.

Производительность и сравнения

Итак, как эти модели показывают себя? Цукерберг четко обозначил свое видение лидерства ИИ с открытым исходным кодом, и Llama 4 — большой шаг в этом направлении. Хотя они, возможно, не устанавливают новых рекордов производительности по всем параметрам, они определенно находятся в числе лидеров своего класса. Например, Llama 4 Behemoth превосходит некоторых тяжеловесов в определенных тестах, хотя все еще отстает от DeepSeek R1 и серии o1 от OpenAI в других.

Llama 4 Behemoth

  • Превосходит GPT-4.5, Gemini 2.0 Pro и Claude Sonnet 3.7 в тестах MATH-500 (95.0), GPQA Diamond (73.7) и MMLU Pro (82.2)

График производительности Llama 4 Behemoth

Llama 4 Maverick

  • Превосходит GPT-4o и Gemini 2.0 Flash в большинстве тестов мультимодального логического вывода, таких как ChartQA, DocVQA, MathVista и MMMU
  • Конкурентоспособен с DeepSeek v3.1, используя менее половины активных параметров
  • Результаты тестов: ChartQA (90.0), DocVQA (94.4), MMLU Pro (80.5)

График производительности Llama 4 Maverick

Llama 4 Scout

  • Соответствует или превосходит модели, такие как Mistral 3.1, Gemini 2.0 Flash-Lite и Gemma 3 в тестах DocVQA (94.4), MMLU Pro (74.3) и MathVista (70.7)
  • Непревзойденная длина контекста в 10 миллионов токенов — идеально для длинных документов и кодовых баз

График производительности Llama 4 Scout

Сравнение с DeepSeek R1

Когда речь заходит о высшей лиге, Llama 4 Behemoth держится достойно, но не совсем вытесняет DeepSeek R1 или серию o1 от OpenAI. Она немного отстает в тестах MATH-500 и MMLU, но опережает в GPQA Diamond. Тем не менее, очевидно, что Llama 4 — сильный конкурент в области логического вывода.

ТестLlama 4 BehemothDeepSeek R1OpenAI o1-1217
MATH-50095.097.396.4
GPQA Diamond73.771.575.7
MMLU82.290.891.8

Безопасность и политическая нейтральность

Meta также не забыла о безопасности. Они представили инструменты, такие как Llama Guard, Prompt Guard и CyberSecEval, чтобы поддерживать порядок. И они делают акцент на снижении политической предвзятости, стремясь к более сбалансированному подходу, особенно после того, как Цукерберг отметил поддержку республиканской политики после выборов 2024 года.

Будущее с Llama 4

С Llama 4 Meta раздвигает границы эффективности, открытости и производительности в ИИ. Будь то создание ИИ-помощников корпоративного уровня или глубокое погружение в исследования ИИ, Llama 4 предлагает мощные и гибкие варианты, которые приоритетно ориентированы на логический вывод. Очевидно, что Meta стремится сделать ИИ более доступным и влиятельным для всех.

Связанная статья
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
Теперь Meta AI отвечает на сообщения покупателей на Facebook Marketplace Теперь Meta AI отвечает на сообщения покупателей на Facebook Marketplace Facebook Marketplace внедряет новые функции Meta AI, в том числе автоматические ответы на запросы покупателей, как сообщила компания в четверг. Платформа также использует искусственный интеллект для у
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Рекомендации по связанным специальным темам
Бизнес Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине
Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине

Откройте для себя лучшее программное обеспечение 2026 года для оптимизации цен с помощью ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены высокооцененные, революционные инструменты, которые отслеживают конкурентов и автоматически корректируют цены в вашем магазине для получения максимальной прибыли. Сравните бесплатные и платные варианты на основе реальных тестов. Получите преимущество в ценообразовании уже сейчас.

10 инструментов
xix.ai
код Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях
Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях

Откройте для себя 20 лучших рецензентов кода на базе ИИ 2026 года на XIX.AI. В нашем тщательно составленном списке представлены высокооцененные, революционные инструменты для автоматизации проверки соответствия стандартам чистого кода и рефакторинга файлов в устаревших репозиториях. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Получите преимущество ИИ уже сегодня.

10 инструментов
xix.ai
Преобразование текста в речь Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения
Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов
xix.ai
Создание комиксов Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии
Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов
xix.ai
Бизнес Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы
Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов
xix.ai
Бизнес Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами
Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов
xix.ai
Комментарии (30)
0/500
MichaelThomas
MichaelThomas 4 апреля 2026 г., 1:00:35 GMT+03:00

A 2 trillion parameter model? The environmental footprint of training these behemoths is starting to overshadow the hype for me. Meta's scale race is impressive, but I hope the next headline is about efficiency breakthroughs, not just size. 🌍💔

LarryWilliams
LarryWilliams 25 марта 2026 г., 21:01:12 GMT+03:00

Honnêtement, l'IA est en train de devenir une course aux armements écologique... Meta sort un modèle de 2T paramètres, mais on ne parle jamais de l'énergie nécessaire pour l'entraîner. DeepSeek R1 montre qu'on peut être efficace sans monstre énergivore. Un peu de sobriété, peut-être ? 🌱

CarlGonzalez
CarlGonzalez 3 марта 2026 г., 1:00:52 GMT+03:00

Ладно, Meta выпускает Llama 4 с 2 триллионами параметров... Но я до сих пор не могу заставить свою предыдущую модель правильно переводить рецепт борща! 😅 Интересно, эти «революционные» модели когда-нибудь действительно поймут культурные нюансы или просто станут мастерами генерации клише?

BruceRoberts
BruceRoberts 23 октября 2025 г., 19:30:35 GMT+03:00

Meta qui continue la course aux armements avec ces modèles à 2T paramètres... mais franchement, c'est pas un peu excessif ? En janvier on avait déjà DeepSeek R1 qui montrait qu'on pouvait faire mieux avec moins. J'ai l'impression qu'ils cherchent juste à impressionner avec des chiffres gigantesques 🤔

OwenLewis
OwenLewis 24 августа 2025 г., 16:01:19 GMT+03:00

Llama 4 sounds like a beast! That 10M token context window is wild—imagine analyzing entire books in one go. But can Meta keep up with DeepSeek’s efficiency? Excited for Behemoth, though! 🚀

RogerSanchez
RogerSanchez 24 апреля 2025 г., 22:53:44 GMT+03:00

Llama 4 정말 대단해요! 긴 문맥 스카우트와 마버릭 모델은 놀랍네요. 2T 파라미터의 괴물이 나올 걸 기대하고 있어요. 다만, 설정하는 게 좀 복잡해요. 그래도, AI의 미래가 밝아 보이네요! 🚀

OR