Дом
Meta представляет Llama 4 с длинным контекстом и моделями Maverick, 2T Parameter Bhemoth скоро появится!
В январе 2025 года мир ИИ был потрясен, когда относительно неизвестный китайский стартап в области ИИ, DeepSeek, бросил вызов с их революционной моделью логического вывода с открытым исходным кодом, DeepSeek R1. Эта модель не только превзошла таких гигантов, как Meta, но и сделала это при значительно меньших затратах — по слухам, всего за несколько миллионов долларов. Это тот бюджет, который Meta могла бы потратить на пару своих лидеров команд ИИ! Эта новость вызвала у Meta некоторую панику, особенно потому, что их последняя модель Llama, версия 3.3, выпущенная всего месяц назад, уже выглядела немного устаревшей.
Сегодня основатель и генеральный директор Meta, Марк Цукерберг, объявил в Instagram о запуске новой серии Llama 4. Эта серия включает Llama 4 Maverick с 400 миллиардами параметров и Llama 4 Scout с 109 миллиардами параметров, оба доступны для разработчиков для загрузки и немедленного экспериментирования на llama.com и Hugging Face. Также представлен предварительный обзор колоссальной модели с 2 триллионами параметров, Llama 4 Behemoth, которая все еще находится в стадии обучения, и дата выпуска пока не объявлена.
Мультимодальные и длинноконтекстные возможности
Одной из выдающихся особенностей этих новых моделей является их мультимодальность. Они не только работают с текстом, но также могут обрабатывать видео и изображения. Кроме того, они имеют невероятно длинные контекстные окна — 1 миллион токенов для Maverick и впечатляющие 10 миллионов для Scout. Для сравнения, это как обработка до 1500 и 15 000 страниц текста за один раз! Представьте возможности для таких областей, как медицина, наука или литература, где нужно обрабатывать и генерировать огромные объемы информации.
Архитектура смеси экспертов
Все три модели Llama 4 используют архитектуру "смеси экспертов" (MoE), технику, которая набирает популярность благодаря таким компаниям, как OpenAI и Mistral. Этот подход объединяет несколько меньших, специализированных моделей в одну большую и более эффективную модель. Каждая модель Llama 4 состоит из 128 различных экспертов, что означает, что только необходимый эксперт и общий эксперт обрабатывают каждый токен, делая модели более экономичными и быстрыми в работе. Meta утверждает, что Llama 4 Maverick можно запускать на одном хосте Nvidia H100 DGX, что упрощает развертывание.
Экономичность и доступность
Meta стремится сделать эти модели доступными. И Scout, и Maverick доступны для самостоятельного хостинга, и они даже поделились привлекательными оценками затрат. Например, стоимость вывода для Llama 4 Maverick составляет от $0.19 до $0.49 за миллион токенов, что является выгодной сделкой по сравнению с другими проприетарными моделями, такими как GPT-4o. А если вы хотите использовать эти модели через облачного провайдера, Groq уже предложил конкурентоспособные цены.
Улучшенные способности к логическому выводу и MetaP
Эти модели созданы с учетом логического вывода, программирования и решения задач. Meta использовала некоторые умные техники во время обучения для усиления этих возможностей, такие как удаление простых запросов и использование непрерывного обучения с подкреплением с постепенно усложняющимися запросами. Они также представили MetaP, новую технику, которая позволяет устанавливать гиперпараметры на одной модели и применять их к другим, экономя время и деньги. Это кардинально меняет ситуацию, особенно для обучения таких монстров, как Behemoth, который использует 32 тысячи графических процессоров и обрабатывает более 30 триллионов токенов.
Производительность и сравнения
Итак, как эти модели показывают себя? Цукерберг четко обозначил свое видение лидерства ИИ с открытым исходным кодом, и Llama 4 — большой шаг в этом направлении. Хотя они, возможно, не устанавливают новых рекордов производительности по всем параметрам, они определенно находятся в числе лидеров своего класса. Например, Llama 4 Behemoth превосходит некоторых тяжеловесов в определенных тестах, хотя все еще отстает от DeepSeek R1 и серии o1 от OpenAI в других.
Llama 4 Behemoth
- Превосходит GPT-4.5, Gemini 2.0 Pro и Claude Sonnet 3.7 в тестах MATH-500 (95.0), GPQA Diamond (73.7) и MMLU Pro (82.2)

Llama 4 Maverick
- Превосходит GPT-4o и Gemini 2.0 Flash в большинстве тестов мультимодального логического вывода, таких как ChartQA, DocVQA, MathVista и MMMU
- Конкурентоспособен с DeepSeek v3.1, используя менее половины активных параметров
- Результаты тестов: ChartQA (90.0), DocVQA (94.4), MMLU Pro (80.5)

Llama 4 Scout
- Соответствует или превосходит модели, такие как Mistral 3.1, Gemini 2.0 Flash-Lite и Gemma 3 в тестах DocVQA (94.4), MMLU Pro (74.3) и MathVista (70.7)
- Непревзойденная длина контекста в 10 миллионов токенов — идеально для длинных документов и кодовых баз

Сравнение с DeepSeek R1
Когда речь заходит о высшей лиге, Llama 4 Behemoth держится достойно, но не совсем вытесняет DeepSeek R1 или серию o1 от OpenAI. Она немного отстает в тестах MATH-500 и MMLU, но опережает в GPQA Diamond. Тем не менее, очевидно, что Llama 4 — сильный конкурент в области логического вывода.
Тест Llama 4 Behemoth DeepSeek R1 OpenAI o1-1217 MATH-500 95.0 97.3 96.4 GPQA Diamond 73.7 71.5 75.7 MMLU 82.2 90.8 91.8
Безопасность и политическая нейтральность
Meta также не забыла о безопасности. Они представили инструменты, такие как Llama Guard, Prompt Guard и CyberSecEval, чтобы поддерживать порядок. И они делают акцент на снижении политической предвзятости, стремясь к более сбалансированному подходу, особенно после того, как Цукерберг отметил поддержку республиканской политики после выборов 2024 года.
Будущее с Llama 4
С Llama 4 Meta раздвигает границы эффективности, открытости и производительности в ИИ. Будь то создание ИИ-помощников корпоративного уровня или глубокое погружение в исследования ИИ, Llama 4 предлагает мощные и гибкие варианты, которые приоритетно ориентированы на логический вывод. Очевидно, что Meta стремится сделать ИИ более доступным и влиятельным для всех.
Связанная статья
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
Теперь Meta AI отвечает на сообщения покупателей на Facebook Marketplace
Facebook Marketplace внедряет новые функции Meta AI, в том числе автоматические ответы на запросы покупателей, как сообщила компания в четверг. Платформа также использует искусственный интеллект для у
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Рекомендации по связанным специальным темам
Комментарии (30)
A 2 trillion parameter model? The environmental footprint of training these behemoths is starting to overshadow the hype for me. Meta's scale race is impressive, but I hope the next headline is about efficiency breakthroughs, not just size. 🌍💔
Honnêtement, l'IA est en train de devenir une course aux armements écologique... Meta sort un modèle de 2T paramètres, mais on ne parle jamais de l'énergie nécessaire pour l'entraîner. DeepSeek R1 montre qu'on peut être efficace sans monstre énergivore. Un peu de sobriété, peut-être ? 🌱
Ладно, Meta выпускает Llama 4 с 2 триллионами параметров... Но я до сих пор не могу заставить свою предыдущую модель правильно переводить рецепт борща! 😅 Интересно, эти «революционные» модели когда-нибудь действительно поймут культурные нюансы или просто станут мастерами генерации клише?
Meta qui continue la course aux armements avec ces modèles à 2T paramètres... mais franchement, c'est pas un peu excessif ? En janvier on avait déjà DeepSeek R1 qui montrait qu'on pouvait faire mieux avec moins. J'ai l'impression qu'ils cherchent juste à impressionner avec des chiffres gigantesques 🤔
Llama 4 sounds like a beast! That 10M token context window is wild—imagine analyzing entire books in one go. But can Meta keep up with DeepSeek’s efficiency? Excited for Behemoth, though! 🚀
В январе 2025 года мир ИИ был потрясен, когда относительно неизвестный китайский стартап в области ИИ, DeepSeek, бросил вызов с их революционной моделью логического вывода с открытым исходным кодом, DeepSeek R1. Эта модель не только превзошла таких гигантов, как Meta, но и сделала это при значительно меньших затратах — по слухам, всего за несколько миллионов долларов. Это тот бюджет, который Meta могла бы потратить на пару своих лидеров команд ИИ! Эта новость вызвала у Meta некоторую панику, особенно потому, что их последняя модель Llama, версия 3.3, выпущенная всего месяц назад, уже выглядела немного устаревшей.
Сегодня основатель и генеральный директор Meta, Марк Цукерберг, объявил в Instagram о запуске новой серии Llama 4. Эта серия включает Llama 4 Maverick с 400 миллиардами параметров и Llama 4 Scout с 109 миллиардами параметров, оба доступны для разработчиков для загрузки и немедленного экспериментирования на llama.com и Hugging Face. Также представлен предварительный обзор колоссальной модели с 2 триллионами параметров, Llama 4 Behemoth, которая все еще находится в стадии обучения, и дата выпуска пока не объявлена.
Мультимодальные и длинноконтекстные возможности
Одной из выдающихся особенностей этих новых моделей является их мультимодальность. Они не только работают с текстом, но также могут обрабатывать видео и изображения. Кроме того, они имеют невероятно длинные контекстные окна — 1 миллион токенов для Maverick и впечатляющие 10 миллионов для Scout. Для сравнения, это как обработка до 1500 и 15 000 страниц текста за один раз! Представьте возможности для таких областей, как медицина, наука или литература, где нужно обрабатывать и генерировать огромные объемы информации.
Архитектура смеси экспертов
Все три модели Llama 4 используют архитектуру "смеси экспертов" (MoE), технику, которая набирает популярность благодаря таким компаниям, как OpenAI и Mistral. Этот подход объединяет несколько меньших, специализированных моделей в одну большую и более эффективную модель. Каждая модель Llama 4 состоит из 128 различных экспертов, что означает, что только необходимый эксперт и общий эксперт обрабатывают каждый токен, делая модели более экономичными и быстрыми в работе. Meta утверждает, что Llama 4 Maverick можно запускать на одном хосте Nvidia H100 DGX, что упрощает развертывание.
Экономичность и доступность
Meta стремится сделать эти модели доступными. И Scout, и Maverick доступны для самостоятельного хостинга, и они даже поделились привлекательными оценками затрат. Например, стоимость вывода для Llama 4 Maverick составляет от $0.19 до $0.49 за миллион токенов, что является выгодной сделкой по сравнению с другими проприетарными моделями, такими как GPT-4o. А если вы хотите использовать эти модели через облачного провайдера, Groq уже предложил конкурентоспособные цены.
Улучшенные способности к логическому выводу и MetaP
Эти модели созданы с учетом логического вывода, программирования и решения задач. Meta использовала некоторые умные техники во время обучения для усиления этих возможностей, такие как удаление простых запросов и использование непрерывного обучения с подкреплением с постепенно усложняющимися запросами. Они также представили MetaP, новую технику, которая позволяет устанавливать гиперпараметры на одной модели и применять их к другим, экономя время и деньги. Это кардинально меняет ситуацию, особенно для обучения таких монстров, как Behemoth, который использует 32 тысячи графических процессоров и обрабатывает более 30 триллионов токенов.
Производительность и сравнения
Итак, как эти модели показывают себя? Цукерберг четко обозначил свое видение лидерства ИИ с открытым исходным кодом, и Llama 4 — большой шаг в этом направлении. Хотя они, возможно, не устанавливают новых рекордов производительности по всем параметрам, они определенно находятся в числе лидеров своего класса. Например, Llama 4 Behemoth превосходит некоторых тяжеловесов в определенных тестах, хотя все еще отстает от DeepSeek R1 и серии o1 от OpenAI в других.
Llama 4 Behemoth
- Превосходит GPT-4.5, Gemini 2.0 Pro и Claude Sonnet 3.7 в тестах MATH-500 (95.0), GPQA Diamond (73.7) и MMLU Pro (82.2)

Llama 4 Maverick
- Превосходит GPT-4o и Gemini 2.0 Flash в большинстве тестов мультимодального логического вывода, таких как ChartQA, DocVQA, MathVista и MMMU
- Конкурентоспособен с DeepSeek v3.1, используя менее половины активных параметров
- Результаты тестов: ChartQA (90.0), DocVQA (94.4), MMLU Pro (80.5)

Llama 4 Scout
- Соответствует или превосходит модели, такие как Mistral 3.1, Gemini 2.0 Flash-Lite и Gemma 3 в тестах DocVQA (94.4), MMLU Pro (74.3) и MathVista (70.7)
- Непревзойденная длина контекста в 10 миллионов токенов — идеально для длинных документов и кодовых баз

Сравнение с DeepSeek R1
Когда речь заходит о высшей лиге, Llama 4 Behemoth держится достойно, но не совсем вытесняет DeepSeek R1 или серию o1 от OpenAI. Она немного отстает в тестах MATH-500 и MMLU, но опережает в GPQA Diamond. Тем не менее, очевидно, что Llama 4 — сильный конкурент в области логического вывода.
| Тест | Llama 4 Behemoth | DeepSeek R1 | OpenAI o1-1217 |
|---|---|---|---|
| MATH-500 | 95.0 | 97.3 | 96.4 |
| GPQA Diamond | 73.7 | 71.5 | 75.7 |
| MMLU | 82.2 | 90.8 | 91.8 |
Безопасность и политическая нейтральность
Meta также не забыла о безопасности. Они представили инструменты, такие как Llama Guard, Prompt Guard и CyberSecEval, чтобы поддерживать порядок. И они делают акцент на снижении политической предвзятости, стремясь к более сбалансированному подходу, особенно после того, как Цукерберг отметил поддержку республиканской политики после выборов 2024 года.
Будущее с Llama 4
С Llama 4 Meta раздвигает границы эффективности, открытости и производительности в ИИ. Будь то создание ИИ-помощников корпоративного уровня или глубокое погружение в исследования ИИ, Llama 4 предлагает мощные и гибкие варианты, которые приоритетно ориентированы на логический вывод. Очевидно, что Meta стремится сделать ИИ более доступным и влиятельным для всех.
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
Теперь Meta AI отвечает на сообщения покупателей на Facebook Marketplace
Facebook Marketplace внедряет новые функции Meta AI, в том числе автоматические ответы на запросы покупателей, как сообщила компания в четверг. Платформа также использует искусственный интеллект для у
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
A 2 trillion parameter model? The environmental footprint of training these behemoths is starting to overshadow the hype for me. Meta's scale race is impressive, but I hope the next headline is about efficiency breakthroughs, not just size. 🌍💔
Honnêtement, l'IA est en train de devenir une course aux armements écologique... Meta sort un modèle de 2T paramètres, mais on ne parle jamais de l'énergie nécessaire pour l'entraîner. DeepSeek R1 montre qu'on peut être efficace sans monstre énergivore. Un peu de sobriété, peut-être ? 🌱
Ладно, Meta выпускает Llama 4 с 2 триллионами параметров... Но я до сих пор не могу заставить свою предыдущую модель правильно переводить рецепт борща! 😅 Интересно, эти «революционные» модели когда-нибудь действительно поймут культурные нюансы или просто станут мастерами генерации клише?
Meta qui continue la course aux armements avec ces modèles à 2T paramètres... mais franchement, c'est pas un peu excessif ? En janvier on avait déjà DeepSeek R1 qui montrait qu'on pouvait faire mieux avec moins. J'ai l'impression qu'ils cherchent juste à impressionner avec des chiffres gigantesques 🤔
Llama 4 sounds like a beast! That 10M token context window is wild—imagine analyzing entire books in one go. But can Meta keep up with DeepSeek’s efficiency? Excited for Behemoth, though! 🚀











