L'IA de Github Copilot testé: le succès du codage mixte me laisse déconcerté

Maison

Nouvelles

21 avril 2025

GregoryAllen

288

Exploration des incohérences dans les outils de codage IA

Il est vraiment déroutant de constater comment les outils d'IA, tous construits sur le même modèle de langage large de base, peuvent produire des résultats aussi variés. Par exemple, ChatGPT, Perplexity et GitHub Copilot exploitent tous le modèle GPT-4 d'OpenAI. Pourtant, mes tests récents ont montré des différences marquées dans les performances : tandis que ChatGPT et les plans pro de Perplexity ont excellé, GitHub Copilot n'a eu qu'un taux de réussite de 50 %.

J'ai effectué ces tests en utilisant GitHub Copilot intégré dans un environnement VS Code. Je partagerai un guide détaillé sur la configuration de cet environnement dans un prochain article. Pour l'instant, plongeons dans les spécificités des tests que j'ai réalisés.

Si vous êtes curieux de connaître ma méthodologie de test et les invites utilisées, vous pouvez consulter mon guide détaillé sur l'évaluation des capacités de codage d'un chatbot IA.

TL;DR : GitHub Copilot a réussi deux des quatre tests que j'ai effectués.

Test 1 : Écriture d'un plugin WordPress

Ce test a été une complète déception. C'était mon expérience initiale, me laissant incertain si GitHub Copilot a des difficultés avec le codage ou si les contraintes d'interaction dans VS Code limitent ses capacités.

Voici le contexte : j'ai demandé à l'IA de développer un plugin WordPress entièrement fonctionnel incluant une interface d'administration et une logique opérationnelle. La tâche du plugin était d'accepter une liste de noms, de les trier et de séparer les doublons pour éviter leur adjacence.

Cette tâche découlait d'un besoin réel de l'entreprise de commerce électronique de biens numériques de ma femme, où elle gère un groupe Facebook actif.

Alors que cinq des dix modèles d'IA testés ont réussi ce test entièrement, trois ont réussi partiellement, et deux, y compris Microsoft Copilot, ont complètement échoué. GitHub Copilot, bien qu'ayant reçu la même invite, n'a produit que du code PHP. Bien que le problème puisse effectivement être résolu uniquement avec PHP, GitHub Copilot a tenté de référencer JavaScript sans réellement le générer.

Capture d'écran par David Gewirtz/ZDNET

Lorsque j'ai essayé de pousser GitHub Copilot à partir d'un fichier JavaScript pour compléter la tâche, il a bizarrement répondu avec encore plus de code PHP, tout en référenciant un fichier JavaScript inexistant.

Capture d'écran par David Gewirtz/ZDNET

Test 2 : Réécriture d'une fonction de chaîne

Ce test était relativement simple : j'ai fourni une fonction destinée à valider les dollars et les cents, mais qui ne vérifiait que les dollars entiers. Le défi était pour l'IA de corriger la fonction.

GitHub Copilot a modifié le code, mais le résultat était problématique. Il supposait que toute chaîne d'entrée était valide, ce qui provoquerait des erreurs si la chaîne était vide. De plus, l'expression régulière mise à jour ne pouvait pas gérer divers cas limites, comme les entrées "3.", ".3" ou "00.30". Pour une fonction destinée à valider une monnaie, de telles négligences sont inacceptables, marquant un autre échec pour GitHub Copilot.

Test 3 : Trouver un bogue agaçant

Ici, GitHub Copilot a brillé. Ce test était basé sur un véritable défi de codage auquel j'ai été confronté, où le message d'erreur ne pointait pas directement vers le problème réel. C'est un peu comme une énigme de codage, nécessitant une compréhension approfondie des appels d'API WordPress pour résoudre.

Alors que Microsoft Copilot, Gemini et Meta Code Llama ont trébuché sur ce test, GitHub Copilot l'a réussi brillamment, démontrant sa capacité à résoudre des problèmes complexes du monde réel.

Test 4 : Écriture d'un script

GitHub Copilot a également réussi ce test, là où Microsoft Copilot a échoué. La tâche impliquait de créer un script qui devait intégrer AppleScript, le modèle d'objet Chrome, et un utilitaire spécifique à Mac appelé Keyboard Maestro.

Pour réussir, l'IA devait reconnaître et gérer les nuances des trois environnements, et GitHub Copilot l'a fait avec brio.

Réflexions finales

Il est décevant de voir GitHub Copilot, qui utilise le modèle avancé GPT-4, échouer la moitié des tests. Étant donné le statut de GitHub en tant que plateforme de gestion de sources de premier plan, on pourrait s'attendre à ce que son support de codage IA soit plus fiable.

Cependant, le monde de l'IA évolue constamment, et je suis optimiste quant à l'amélioration des performances de GitHub Copilot avec le temps. Nous reviendrons sur ce sujet dans quelques mois pour voir comment il a progressé.

Vous fiez-vous à l'IA pour une assistance au codage ? Quel outil IA est votre préféré ? Avez-vous essayé GitHub Copilot ? Partagez vos expériences dans les commentaires ci-dessous.

Restez à jour avec mes progrès quotidiens sur les projets via les réseaux sociaux. N'oubliez pas de vous abonner à ma newsletter hebdomadaire, et suivez-moi sur Twitter/X à @DavidGewirtz, sur Facebook à Facebook.com/DavidGewirtz, sur Instagram à Instagram.com/DavidGewirtz, sur Bluesky à @DavidGewirtz.com, et sur YouTube à YouTube.com/DavidGewirtzTV.

Article connexe

Grok de Musk : 1 500 milliards de paramètres et intégration du code du curseur — Une véritable révolution ou un simple coup de bluff ? Elon Musk passe enfin à l'action.Dans la course à la programmation de l'IA, OpenAI et Anthropic accélèrent, tandis que xAI semble à la traîne. Musk a souvent affirmé son objectif de rivaliser avec Cla

OpenAI modifie discrètement ses statuts pour compliquer le licenciement d'Altman À la suite de l'incident de 2023, qui s'apparentait à un coup d'État, OpenAI a encore renforcé les protections dont bénéficie son PDG, Sam Altman, en mettant à jour ses statuts. Des doc

Meta AI répond désormais aux messages des acheteurs sur Facebook Marketplace Facebook Marketplace lance de nouvelles fonctionnalités basées sur l'IA de Meta, notamment des réponses automatiques aux demandes des acheteurs, a annoncé jeudi l'entreprise. La plateforme u

Recommandations de sujets spéciaux liés

Productivité

Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils

xix.ai

chatbot

Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils

xix.ai

Éducation et apprentissage

Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique

Découvrez les meilleurs mentors en sciences des données et en intelligence artificielle pour 2026 afin de maîtriser SQL, Pandas et les workflows d'apprentissage automatique. Explorez notre sélection soigneusement élaborée sur XIX.AI pour bénéficier d'une guidance puissante et révolutionnaire. Comparez les options gratuites et payantes en tenant compte de perspectives pratiques. Développez rapidement vos compétences en sciences des données.

10 outils

xix.ai

chatbot

Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel

Découvrez les meilleurs outils d'entraînement au flirt et à la conversation basés sur l'IA de 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée vous aide à développer votre charisme social et votre confiance en vous en temps réel. Découvrez des outils incontournables qui changent la donne, avec des comparaisons entre versions gratuites et payantes ainsi que des classements mis à jour chaque semaine. Développez dès aujourd'hui vos compétences sociales.

10 outils

xix.ai

code

Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic

Découvrez les derniers outils d'IA hautement réputés de 2026 pour les tests unitaires automatisés. Notre sélection rigoureusement élaborée vous propose des solutions puissantes et révolutionnaires pour générer instantanément des cas de test Jest, PyTest et JUnit. Comparez les options gratuites et payantes à l'aide de tests réels et des classements mises à jour chaque semaine sur XIX.AI. Développez un avantage concurrentiel grâce à l'IA et améliorez rapidement votre productivité en développement.

10 outils

xix.ai

Analyse des données

Les meilleurs outils de visualisation de données basés sur l'IA : générez automatiquement des tableaux de bord BI interactifs à partir de fichiers bruts

Découvrez les meilleurs outils de visualisation de données par IA de 2026 sur XIX.AI. Notre sélection rigoureuse et hautement notée vous aide à générer instantanément et automatiquement des tableaux de bord BI puissants et interactifs à partir de fichiers bruts. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Libérez dès aujourd'hui le potentiel de vos données.

10 outils

xix.ai

commentaires (40)

0/500

Veuillez vous connecter d'abord

HarryMartinez

28 mai 2026 08:00:14 UTC+02:00

Honestly, this doesn't surprise me. Even with the same underlying model, the way each tool fine-tunes prompts and handles context makes a huge difference. Copilot's mixed results probably come from its integration with IDE specifics. Still, it's baffling why the same model can give such inconsistent outputs for similar tasks. 🤔

EricAllen

19 mai 2026 04:00:12 UTC+02:00

Ich hab's auch ausprobiert und finde es echt seltsam, dass die Ergebnisse so unterschiedlich sind, obwohl die Basis ähnlich ist. Manchmal schreibt Copilot super Code, manchmal totalen Unsinn. Vielleicht liegt's an der Integration in die IDE? 🤔 Auf jeden Fall muss da noch viel verbessert werden, bevor ich mich voll darauf verlassen kann.

ArthurJackson

11 mars 2026 21:00:47 UTC+01:00

Интересно, почему ИИ-инструменты на одной базовой модели GPT-4 работают так по-разному? GitHub Copilot иногда генерирует код, который выглядит логично, но потом выдает полную ерунду 😅 Может, дело в тонкой настройке или контексте? Это напоминает мне капризного коллегу-программиста, который то гений, то беспомощен.

LarryMartin

27 novembre 2025 13:30:43 UTC+01:00

이 기사 읽어보니 AI 코딩 도구의 편차가 정말 신기하네요. 같은 기술인데 결과가 이렇게 다를 수 있다니... 개발자로 일하면서 Copilot이 가끔 완벽한 코드를 써주다가도 갑자기 엉뚱한 걸 제안해서 당황했던 적이 많아요. 🤔 앞으로 AI 도구들이 더 안정화되길 바랍니다!

PaulRoberts

8 novembre 2025 05:30:36 UTC+01:00

Acho frustrante que ferramentas como Copilot e ChatGPT usem o mesmo modelo base mas tenham performances tão diferentes. Isso me faz questionar se a implementação é realmente bem feita ou se só estão colocando um nome famoso pra vender mais. 🤔

EricDavis

1 novembre 2025 17:30:33 UTC+01:00

看完這篇測試我笑了 😂 明明都是用GPT-4，怎麼Copilot寫程式碼的表現這麼迷？有時候像資深工程師，有時候根本在胡言亂語。該不會AI也有生理期吧？（開玩笑的）不過這倒是讓我猶豫要不要續訂了...

Top nouvelles

AI Builder et Power Automate Révolutionnent la Synthèse de Documents Podcast Hosts Of NoteBookLM maintenant disponible pour les interviews La Chine dévoile ses normes nationales relatives aux robots humanoïdes et à l'intelligence incarnée L'adoption de l'IA par les entreprises plafonne, selon les données de Ramp Tutoriel Créateur d'Images Bing : Guide de Génération d'Art IA Apprenez à créer de la musique AI en utilisant votre voix: un tutoriel Suno étape par étape iMyFone MagicMic : Revue et tutoriel sur le changeur de voix AI en temps réel Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives DeepSeek V4 s'impose comme une technologie multimodale révolutionnaire dans le domaine de l'IA Embodied Intelligence dévoile la première norme sectorielle visant à freiner la croissance anarchique

Plus

En vedette