вариант
Дом
Новости
Meta AI не может конкурировать с Llama, Gemini и CHATGPT в тесте кодирования

Meta AI не может конкурировать с Llama, Gemini и CHATGPT в тесте кодирования

3 июня 2025 г.
83

Как хорошо инструменты ИИ пишут код?

За последний год или около того я тестировал несколько больших языковых моделей, чтобы оценить, насколько эффективно они справляются с базовыми задачами программирования. Идея этих тестов проста: если они не могут справиться с основами, вряд ли они будут полезны для более сложных задач. Но если они хорошо справляются с базовыми задачами, они могут стать ценными союзниками для разработчиков, стремящихся сэкономить время.

Для установления базового уровня я использовал четыре различных теста. Они варьируются от простых заданий по программированию до упражнений по отладке, требующих глубокого понимания таких фреймворков, как WordPress. Давайте разберем каждый тест и сравним, как новый инструмент ИИ от Meta справляется в сравнении с другими.

Тест 1: Написание плагина для WordPress

Создание плагина для WordPress включает веб-разработку с использованием PHP в экосистеме WordPress. Также требуется некоторый дизайн пользовательского интерфейса. Если чат-бот с ИИ справится с этим, он может стать полезным помощником для веб-разработчиков.

Результаты:

  • Meta AI: Адекватный интерфейс, но функциональность не удалась.
  • Meta Code Llama: Полный провал.
  • Google Gemini Advanced: Хороший интерфейс, функциональность не удалась.
  • ChatGPT: Чистый интерфейс и рабочий результат.

Вот визуальное сравнение: Тест интерфейса(Примечание: Замените "/path-to-image/" на фактический путь к файлу изображения.)

ChatGPT предоставил более аккуратный интерфейс и более логично расположил кнопку "Randomize". Однако, когда дело дошло до фактического запуска плагина, Meta AI рухнул, показав пресловутый "Белый экран смерти".

Тест 2: Переписывание строковой функции

Этот тест оценивает способность ИИ улучшать утилитарные функции. Успех здесь говорит о потенциальной помощи для разработчиков, тогда как провал указывает на необходимость улучшений.

Результаты:

  • Meta AI: Провал из-за неверных корректировок значений, плохой обработки чисел с несколькими знаками после запятой и проблем с форматированием.
  • Meta Code Llama: Успех.
  • Google Gemini Advanced: Провал.
  • ChatGPT: Успех.

В то время как Meta AI споткнулся на этой, казалось бы, простой задаче, Meta Code Llama сумел выделиться, продемонстрировав свои возможности. ChatGPT также показал себя превосходно.

Тест 3: Поиск раздражающей ошибки

Здесь речь идет не о написании кода, а о диагностике проблем. Успех требует глубоких знаний API WordPress и взаимодействия различных частей кодовой базы.

Результаты:

  • Meta AI: Прошел с блеском, определив проблему и предложив улучшение, повышающее эффективность.
  • Meta Code Llama: Провал.
  • Google Gemini Advanced: Провал.
  • ChatGPT: Прошел.

Удивительно, но, несмотря на предыдущие трудности, Meta AI здесь превзошел себя, доказав свой потенциал, но также подчеркнув непоследовательность своих ответов.

Тест 4: Написание скрипта

Этот тест оценивает знание специализированных инструментов, таких как Keyboard Maestro и AppleScript. Оба они довольно нишевые, но представляют более широкий спектр навыков программирования.

Результаты:

  • Meta AI: Не удалось получить данные из Keyboard Maestro.
  • Meta Code Llama: Тот же провал.
  • Google Gemini Advanced: Успех.
  • ChatGPT: Успех.

Gemini и ChatGPT продемонстрировали мастерство в работе с этими инструментами, тогда как предложения Meta оказались недостаточными.

Общие результаты

МодельУспешность
Meta AI1/4
Meta Code Llama1/4
Google Gemini1/4
ChatGPT4/4

Основываясь на моем шестимесячном опыте использования ChatGPT для проектов по программированию, я остаюсь уверенным в его надежности. Другие модели еще не достигли его последовательности и эффективности. Хотя Meta AI показал моменты блеска, его общая производительность оставляет желать лучшего.

Экспериментировали ли вы с этими инструментами? Поделитесь своими мыслями в комментариях ниже!

Связанная статья
AI-управляемое создание музыки: Легко создавайте песни и видео AI-управляемое создание музыки: Легко создавайте песни и видео Создание музыки может быть сложным, требующим времени, ресурсов и опыта. Искусственный интеллект преобразил этот процесс, сделав его простым и доступным. Это руководство показывает, как ИИ позволяет к
Создание раскрасок с использованием ИИ: Полное руководство Создание раскрасок с использованием ИИ: Полное руководство Создание раскрасок — это увлекательное занятие, сочетающее художественное выражение с успокаивающим опытом для пользователей. Однако процесс может быть трудоемким. К счастью, инструменты ИИ упрощают с
Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo, израильский стартап в области AI-кодирования, ориентированный на качество кода, начал сотрудничество с Google Cloud для повышения целостности программного обеспечения, созданного AI.По мере рост
ChristopherTaylor
ChristopherTaylor 12 августа 2025 г., 18:00:59 GMT+03:00

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris
PaulHarris 1 августа 2025 г., 16:47:34 GMT+03:00

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez
MarkGonzalez 28 июля 2025 г., 4:20:02 GMT+03:00

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts
TerryRoberts 22 июля 2025 г., 4:25:03 GMT+03:00

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

Вернуться к вершине
OR