Meta AI не может конкурировать с Llama, Gemini и CHATGPT в тесте кодирования

Дом

Новости

3 июня 2025 г.

GeorgeNelson

222

Как хорошо инструменты ИИ пишут код?

За последний год или около того я тестировал несколько больших языковых моделей, чтобы оценить, насколько эффективно они справляются с базовыми задачами программирования. Идея этих тестов проста: если они не могут справиться с основами, вряд ли они будут полезны для более сложных задач. Но если они хорошо справляются с базовыми задачами, они могут стать ценными союзниками для разработчиков, стремящихся сэкономить время.

Для установления базового уровня я использовал четыре различных теста. Они варьируются от простых заданий по программированию до упражнений по отладке, требующих глубокого понимания таких фреймворков, как WordPress. Давайте разберем каждый тест и сравним, как новый инструмент ИИ от Meta справляется в сравнении с другими.

Тест 1: Написание плагина для WordPress

Создание плагина для WordPress включает веб-разработку с использованием PHP в экосистеме WordPress. Также требуется некоторый дизайн пользовательского интерфейса. Если чат-бот с ИИ справится с этим, он может стать полезным помощником для веб-разработчиков.

Результаты:

Meta AI: Адекватный интерфейс, но функциональность не удалась.
Meta Code Llama: Полный провал.
Google Gemini Advanced: Хороший интерфейс, функциональность не удалась.
ChatGPT: Чистый интерфейс и рабочий результат.

Вот визуальное сравнение: Тест интерфейса (Примечание: Замените "/path-to-image/" на фактический путь к файлу изображения.)

ChatGPT предоставил более аккуратный интерфейс и более логично расположил кнопку "Randomize". Однако, когда дело дошло до фактического запуска плагина, Meta AI рухнул, показав пресловутый "Белый экран смерти".

Тест 2: Переписывание строковой функции

Этот тест оценивает способность ИИ улучшать утилитарные функции. Успех здесь говорит о потенциальной помощи для разработчиков, тогда как провал указывает на необходимость улучшений.

Результаты:

Meta AI: Провал из-за неверных корректировок значений, плохой обработки чисел с несколькими знаками после запятой и проблем с форматированием.
Meta Code Llama: Успех.
Google Gemini Advanced: Провал.
ChatGPT: Успех.

В то время как Meta AI споткнулся на этой, казалось бы, простой задаче, Meta Code Llama сумел выделиться, продемонстрировав свои возможности. ChatGPT также показал себя превосходно.

Тест 3: Поиск раздражающей ошибки

Здесь речь идет не о написании кода, а о диагностике проблем. Успех требует глубоких знаний API WordPress и взаимодействия различных частей кодовой базы.

Результаты:

Meta AI: Прошел с блеском, определив проблему и предложив улучшение, повышающее эффективность.
Meta Code Llama: Провал.
Google Gemini Advanced: Провал.
ChatGPT: Прошел.

Удивительно, но, несмотря на предыдущие трудности, Meta AI здесь превзошел себя, доказав свой потенциал, но также подчеркнув непоследовательность своих ответов.

Тест 4: Написание скрипта

Этот тест оценивает знание специализированных инструментов, таких как Keyboard Maestro и AppleScript. Оба они довольно нишевые, но представляют более широкий спектр навыков программирования.

Результаты:

Meta AI: Не удалось получить данные из Keyboard Maestro.
Meta Code Llama: Тот же провал.
Google Gemini Advanced: Успех.
ChatGPT: Успех.

Gemini и ChatGPT продемонстрировали мастерство в работе с этими инструментами, тогда как предложения Meta оказались недостаточными.

Общие результаты

Модель	Успешность
Meta AI	1/4
Meta Code Llama	1/4
Google Gemini	1/4
ChatGPT	4/4

Основываясь на моем шестимесячном опыте использования ChatGPT для проектов по программированию, я остаюсь уверенным в его надежности. Другие модели еще не достигли его последовательности и эффективности. Хотя Meta AI показал моменты блеска, его общая производительность оставляет желать лучшего.

Экспериментировали ли вы с этими инструментами? Поделитесь своими мыслями в комментариях ниже!

Связанная статья

WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания

Экспериментальный ИИ Claude от компании Anthropic успешно завершил переговоры и сделки в ходе тестирования в сфере электронной коммерции На фоне стремительного развития искусственного интеллекта компания Anthropic в минувшую пятницу незаметно запустила внутренний эксперимент под названием «Project Deal», продемонстрировав потенциал ИИ

DeepSeek Code готовится к запуску На фоне стремительного развития технологий искусственного интеллекта компания DeepSeek находится на захватывающем этапе своего развития. Недавно эта компания, специализирующаяся на ИИ, объявила о прив

Рекомендации по связанным специальным темам

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Образование и обучение

Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени

Откройте для себя 20 лучших тренажеров по флирту и общению с ИИ на сайте XIX.AI. Наша тщательно подобранная подборка самых популярных инструментов поможет вам развить коммуникабельность и уверенность в себе в режиме реального времени. Ознакомьтесь с незаменимыми инструментами, которые кардинально изменят вашу жизнь, — с сравнением бесплатных и платных версий и еженедельно обновляемым рейтингом. Раскройте свой коммуникативный потенциал уже сегодня.

10 инструментов

xix.ai

код

Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом

Откройте для себя самые новые и высоко оцененные инструменты ИИ 2026 года для автоматизированного тестирования модулей. Наша тщательно подобранная коллекция включает мощные решения, способные радикально изменить процесс разработки, позволяющие мгновенно генерировать тестовые случаи для Jest, PyTest и JUnit. Сравните бесплатные и платные варианты с результатами реальных тестов, а также еженедельно обновляемыми рейтингами на сайте XIX.AI. Раскройте потенциал ИИ и повысьте эффективность своей работы в области разработки сегодня же.

10 инструментов

xix.ai

Комментарии (6)

0/500

Пожалуйста, войдите в систему

OliverPhillips

14 мая 2026 г., 5:00:09 GMT+03:00

Interesting test! I've been using ChatGPT for coding help and it's been decent, but honestly I'm more curious about the open-source alternatives like Llama. Meta's AI being behind isn't a huge shock, but it makes you wonder if they're focusing on different strengths. Maybe coding isn't their main goal? 🤔 Still, competition is good for us users!

BillyWilson

30 сентября 2025 г., 11:30:37 GMT+03:00

Meta AI 코딩 테스트 결과는 참 실망스럽네요 😅 다른 경쟁사들보다 확실히 뒤처지는 모습인데... 그래도 아직 초기 단계니까 차차 나아지지 않을까요? 물론 빠르게 따라잡아야 하지만 말이죠!

ChristopherTaylor

12 августа 2025 г., 18:00:59 GMT+03:00

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris

1 августа 2025 г., 16:47:34 GMT+03:00

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez

28 июля 2025 г., 4:20:02 GMT+03:00

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts

22 июля 2025 г., 4:25:03 GMT+03:00

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан