вариант
Дом
Новости
ИИ Github Copilot проверил: смешанный успех кодирования оставляет меня сбитым с толку

ИИ Github Copilot проверил: смешанный успех кодирования оставляет меня сбитым с толку

21 апреля 2025 г.
288

Исследование несоответствий в инструментах кодирования с ИИ

Действительно загадочно, как инструменты ИИ, построенные на одной и той же базовой большой языковой модели, могут давать такие разные результаты. Например, ChatGPT, Perplexity и GitHub Copilot используют модель GPT-4 от OpenAI. Однако мои недавние тесты показали значительные различия в производительности: платные планы ChatGPT и Perplexity показали отличные результаты, тогда как GitHub Copilot имел успех лишь в 50% случаев.

Я проводил эти тесты, используя GitHub Copilot, интегрированный в среду VS Code. В предстоящей статье я поделюсь подробным руководством по настройке этой среды. А пока давайте углубимся в детали проведенных мной тестов.

Если вам любопытна моя методология тестирования и использованные запросы, вы можете ознакомиться с подробным руководством по оценке возможностей кодирования ИИ-чатбота.

Коротко: GitHub Copilot успешно прошел два из четырех проведенных мной тестов.

Тест 1: Написание плагина для WordPress

Этот тест оказался полным разочарованием. Это был мой первый эксперимент, и я остался в недоумении, действительно ли GitHub Copilot плохо справляется с кодированием или ограничения взаимодействия в VS Code мешают его возможностям.

Контекст таков: я попросил ИИ разработать полноценный плагин для WordPress с административным интерфейсом и рабочей логикой. Задача плагина заключалась в том, чтобы принимать список имен, сортировать их и разделять дубликаты, чтобы избежать их соседства.

Эта задача возникла из реальной потребности в бизнесе моей жены по продаже цифровых товаров, где она управляет активной группой в Facebook.

Из десяти протестированных моделей ИИ пять полностью прошли этот тест, три прошли частично, а две, включая Microsoft Copilot, полностью провалились. GitHub Copilot, несмотря на одинаковый запрос, создал только PHP-код. Хотя задачу действительно можно было решить только на PHP, GitHub Copilot пытался ссылаться на JavaScript, не создавая его.

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

Когда я попытался запросить GitHub Copilot из файла JavaScript для завершения задачи, он странным образом ответил дополнительным PHP-кодом, все еще ссылаясь на несуществующий файл JavaScript.

Скриншот от David Gewirtz/ZDNET

Скриншот от David Gewirtz/ZDNET

Тест 2: Переписывание строковой функции

Этот тест был относительно простым: я предоставил функцию, предназначенную для проверки долларов и центов, но проверяющую только целые доллары. Задача заключалась в том, чтобы ИИ исправил функцию.

GitHub Copilot действительно изменил код, но результат был проблемным. Он предполагал, что любая входная строка действительна, что вызвало бы ошибки при пустой строке. Кроме того, обновленное регулярное выражение не могло обработать различные крайние случаи, такие как входные данные "3.", ".3" или "00.30". Для функции, предназначенной для проверки валюты, такие недочеты недопустимы, что означает еще один провал для GitHub Copilot.

Тест 3: Поиск раздражающей ошибки

Здесь GitHub Copilot проявил себя блестяще. Этот тест был основан на реальной задаче кодирования, с которой я столкнулся, где сообщение об ошибке не указывало напрямую на настоящую проблему. Это похоже на загадку кодирования, требующую глубокого понимания вызовов API WordPress для решения.

В то время как Microsoft Copilot, Gemini и Meta Code Llama споткнулись на этом тесте, GitHub Copilot справился с ним, продемонстрировав свою способность решать сложные реальные проблемы.

Тест 4: Написание скрипта

GitHub Copilot также преуспел в этом тесте, где Microsoft Copilot не справился. Задача заключалась в создании скрипта, который должен был интегрировать AppleScript, объектную модель Chrome и утилиту для Mac под названием Keyboard Maestro.

Для прохождения теста ИИ должен был распознать и учесть нюансы всех трех сред, и GitHub Copilot сделал это.

Заключительные мысли

Разочаровывает видеть, что GitHub Copilot, использующий продвинутую модель GPT-4, провалил половину тестов. Учитывая статус GitHub как ведущей платформы управления исходным кодом, можно было бы ожидать, что его поддержка кодирования с ИИ будет более надежной.

Однако мир ИИ постоянно развивается, и я оптимистично настроен на то, что производительность GitHub Copilot со временем улучшится. Мы вернемся к этому через несколько месяцев, чтобы посмотреть, как он продвинулся.

Полагаетесь ли вы на ИИ для помощи в кодировании? Какой инструмент ИИ является вашим основным? Пробовали ли вы GitHub Copilot? Поделитесь своим опытом в комментариях ниже.

Следите за обновлениями моего ежедневного прогресса в проектах в социальных сетях. Не забудьте подписаться на мою еженедельную рассылку и следить за мной на Twitter/X по адресу @DavidGewirtz, на Facebook по адресу Facebook.com/DavidGewirtz, на Instagram по адресу Instagram.com/DavidGewirtz, на Bluesky по адресу @DavidGewirtz.com и на YouTube по адресу YouTube.com/DavidGewirtzTV.

Связанная статья
DeepSeek Code готовится к запуску DeepSeek Code готовится к запуску На фоне стремительного развития технологий искусственного интеллекта компания DeepSeek находится на захватывающем этапе своего развития. Недавно эта компания, специализирующаяся на ИИ, объявила о прив
Grok от Маска: 1,5 триллиона параметров и поглощение кода курсора — прорыв или блеф? Grok от Маска: 1,5 триллиона параметров и поглощение кода курсора — прорыв или блеф? Илон Маск наконец-то делает ход.В гонке по программированию ИИ компании OpenAI и Anthropic набирают обороты, в то время как xAI, похоже, отстает. Маск не раз заявлял о своем намерении составить конкур
OpenAI втайне изменила устав, чтобы затруднить увольнение Альтмана OpenAI втайне изменила устав, чтобы затруднить увольнение Альтмана После инцидента 2023 года, напоминавшего государственный переворот, компания OpenAI еще больше укрепила меры защиты генерального директора Сэма Альтмана, обновив свой устав. Недавно обнародованные суд
Рекомендации по связанным специальным темам
Бизнес Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами
Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов
xix.ai
Производительность Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии
Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью
Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов
xix.ai
Образование и обучение Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения
Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов
xix.ai
чат-бот Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени
Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени

Откройте для себя 20 лучших тренажеров по флирту и общению с ИИ на сайте XIX.AI. Наша тщательно подобранная подборка самых популярных инструментов поможет вам развить коммуникабельность и уверенность в себе в режиме реального времени. Ознакомьтесь с незаменимыми инструментами, которые кардинально изменят вашу жизнь, — с сравнением бесплатных и платных версий и еженедельно обновляемым рейтингом. Раскройте свой коммуникативный потенциал уже сегодня.

10 инструментов
xix.ai
код Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом
Лучшие инструменты ИИ для автоматизированного тестирования модулей: создание случаев тестирования Jest, PyTest и JUnit одним кликом

Откройте для себя самые новые и высоко оцененные инструменты ИИ 2026 года для автоматизированного тестирования модулей. Наша тщательно подобранная коллекция включает мощные решения, способные радикально изменить процесс разработки, позволяющие мгновенно генерировать тестовые случаи для Jest, PyTest и JUnit. Сравните бесплатные и платные варианты с результатами реальных тестов, а также еженедельно обновляемыми рейтингами на сайте XIX.AI. Раскройте потенциал ИИ и повысьте эффективность своей работы в области разработки сегодня же.

10 инструментов
xix.ai
Комментарии (40)
0/500
HarryMartinez
HarryMartinez 28 мая 2026 г., 9:00:14 GMT+03:00

Honestly, this doesn't surprise me. Even with the same underlying model, the way each tool fine-tunes prompts and handles context makes a huge difference. Copilot's mixed results probably come from its integration with IDE specifics. Still, it's baffling why the same model can give such inconsistent outputs for similar tasks. 🤔

EricAllen
EricAllen 19 мая 2026 г., 5:00:12 GMT+03:00

Ich hab's auch ausprobiert und finde es echt seltsam, dass die Ergebnisse so unterschiedlich sind, obwohl die Basis ähnlich ist. Manchmal schreibt Copilot super Code, manchmal totalen Unsinn. Vielleicht liegt's an der Integration in die IDE? 🤔 Auf jeden Fall muss da noch viel verbessert werden, bevor ich mich voll darauf verlassen kann.

ArthurJackson
ArthurJackson 11 марта 2026 г., 23:00:47 GMT+03:00

Интересно, почему ИИ-инструменты на одной базовой модели GPT-4 работают так по-разному? GitHub Copilot иногда генерирует код, который выглядит логично, но потом выдает полную ерунду 😅 Может, дело в тонкой настройке или контексте? Это напоминает мне капризного коллегу-программиста, который то гений, то беспомощен.

LarryMartin
LarryMartin 27 ноября 2025 г., 15:30:43 GMT+03:00

이 기사 읽어보니 AI 코딩 도구의 편차가 정말 신기하네요. 같은 기술인데 결과가 이렇게 다를 수 있다니... 개발자로 일하면서 Copilot이 가끔 완벽한 코드를 써주다가도 갑자기 엉뚱한 걸 제안해서 당황했던 적이 많아요. 🤔 앞으로 AI 도구들이 더 안정화되길 바랍니다!

PaulRoberts
PaulRoberts 8 ноября 2025 г., 7:30:36 GMT+03:00

Acho frustrante que ferramentas como Copilot e ChatGPT usem o mesmo modelo base mas tenham performances tão diferentes. Isso me faz questionar se a implementação é realmente bem feita ou se só estão colocando um nome famoso pra vender mais. 🤔

EricDavis
EricDavis 1 ноября 2025 г., 19:30:33 GMT+03:00

看完這篇測試我笑了 😂 明明都是用GPT-4,怎麼Copilot寫程式碼的表現這麼迷?有時候像資深工程師,有時候根本在胡言亂語。該不會AI也有生理期吧?(開玩笑的)不過這倒是讓我猶豫要不要續訂了...

OR