вариант
Дом
Новости
Meta AI не может конкурировать с Llama, Gemini и CHATGPT в тесте кодирования

Meta AI не может конкурировать с Llama, Gemini и CHATGPT в тесте кодирования

3 июня 2025 г.
85

Как хорошо инструменты ИИ пишут код?

За последний год или около того я тестировал несколько больших языковых моделей, чтобы оценить, насколько эффективно они справляются с базовыми задачами программирования. Идея этих тестов проста: если они не могут справиться с основами, вряд ли они будут полезны для более сложных задач. Но если они хорошо справляются с базовыми задачами, они могут стать ценными союзниками для разработчиков, стремящихся сэкономить время.

Для установления базового уровня я использовал четыре различных теста. Они варьируются от простых заданий по программированию до упражнений по отладке, требующих глубокого понимания таких фреймворков, как WordPress. Давайте разберем каждый тест и сравним, как новый инструмент ИИ от Meta справляется в сравнении с другими.

Тест 1: Написание плагина для WordPress

Создание плагина для WordPress включает веб-разработку с использованием PHP в экосистеме WordPress. Также требуется некоторый дизайн пользовательского интерфейса. Если чат-бот с ИИ справится с этим, он может стать полезным помощником для веб-разработчиков.

Результаты:

  • Meta AI: Адекватный интерфейс, но функциональность не удалась.
  • Meta Code Llama: Полный провал.
  • Google Gemini Advanced: Хороший интерфейс, функциональность не удалась.
  • ChatGPT: Чистый интерфейс и рабочий результат.

Вот визуальное сравнение: Тест интерфейса(Примечание: Замените "/path-to-image/" на фактический путь к файлу изображения.)

ChatGPT предоставил более аккуратный интерфейс и более логично расположил кнопку "Randomize". Однако, когда дело дошло до фактического запуска плагина, Meta AI рухнул, показав пресловутый "Белый экран смерти".

Тест 2: Переписывание строковой функции

Этот тест оценивает способность ИИ улучшать утилитарные функции. Успех здесь говорит о потенциальной помощи для разработчиков, тогда как провал указывает на необходимость улучшений.

Результаты:

  • Meta AI: Провал из-за неверных корректировок значений, плохой обработки чисел с несколькими знаками после запятой и проблем с форматированием.
  • Meta Code Llama: Успех.
  • Google Gemini Advanced: Провал.
  • ChatGPT: Успех.

В то время как Meta AI споткнулся на этой, казалось бы, простой задаче, Meta Code Llama сумел выделиться, продемонстрировав свои возможности. ChatGPT также показал себя превосходно.

Тест 3: Поиск раздражающей ошибки

Здесь речь идет не о написании кода, а о диагностике проблем. Успех требует глубоких знаний API WordPress и взаимодействия различных частей кодовой базы.

Результаты:

  • Meta AI: Прошел с блеском, определив проблему и предложив улучшение, повышающее эффективность.
  • Meta Code Llama: Провал.
  • Google Gemini Advanced: Провал.
  • ChatGPT: Прошел.

Удивительно, но, несмотря на предыдущие трудности, Meta AI здесь превзошел себя, доказав свой потенциал, но также подчеркнув непоследовательность своих ответов.

Тест 4: Написание скрипта

Этот тест оценивает знание специализированных инструментов, таких как Keyboard Maestro и AppleScript. Оба они довольно нишевые, но представляют более широкий спектр навыков программирования.

Результаты:

  • Meta AI: Не удалось получить данные из Keyboard Maestro.
  • Meta Code Llama: Тот же провал.
  • Google Gemini Advanced: Успех.
  • ChatGPT: Успех.

Gemini и ChatGPT продемонстрировали мастерство в работе с этими инструментами, тогда как предложения Meta оказались недостаточными.

Общие результаты

МодельУспешность
Meta AI1/4
Meta Code Llama1/4
Google Gemini1/4
ChatGPT4/4

Основываясь на моем шестимесячном опыте использования ChatGPT для проектов по программированию, я остаюсь уверенным в его надежности. Другие модели еще не достигли его последовательности и эффективности. Хотя Meta AI показал моменты блеска, его общая производительность оставляет желать лучшего.

Экспериментировали ли вы с этими инструментами? Поделитесь своими мыслями в комментариях ниже!

Связанная статья
Master Emerald Kaizo Nuzlocke: Ultimate Survival & Strategy Guide Master Emerald Kaizo Nuzlocke: Ultimate Survival & Strategy Guide Emerald Kaizo - один из самых грозных хаков для Pokémon ROM, которые когда-либо были придуманы. Несмотря на то, что попытка запустить Nuzlocke в разы увеличивает сложность игры, победа остается достиж
Сопроводительные письма на основе искусственного интеллекта: Экспертное руководство по подаче документов в журнал Сопроводительные письма на основе искусственного интеллекта: Экспертное руководство по подаче документов в журнал В сегодняшней конкурентной среде научных изданий составление эффективного сопроводительного письма может сыграть решающую роль в принятии вашей рукописи. Узнайте, как инструменты с искусственным интел
США введут санкции против иностранных чиновников из-за правил пользования социальными сетями США введут санкции против иностранных чиновников из-за правил пользования социальными сетями США выступают против глобального регулирования цифрового контентаНа этой неделе Государственный департамент США выступил с резким дипломатическим обвинением в адрес европейской политики управления ц
BillyWilson
BillyWilson 30 сентября 2025 г., 11:30:37 GMT+03:00

Meta AI 코딩 테스트 결과는 참 실망스럽네요 😅 다른 경쟁사들보다 확실히 뒤처지는 모습인데... 그래도 아직 초기 단계니까 차차 나아지지 않을까요? 물론 빠르게 따라잡아야 하지만 말이죠!

ChristopherTaylor
ChristopherTaylor 12 августа 2025 г., 18:00:59 GMT+03:00

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris
PaulHarris 1 августа 2025 г., 16:47:34 GMT+03:00

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez
MarkGonzalez 28 июля 2025 г., 4:20:02 GMT+03:00

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts
TerryRoberts 22 июля 2025 г., 4:25:03 GMT+03:00

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

Вернуться к вершине
OR