option
Maison
Nouvelles
L'IA de Github Copilot testé: le succès du codage mixte me laisse déconcerté

L'IA de Github Copilot testé: le succès du codage mixte me laisse déconcerté

21 avril 2025
195

Exploration des incohérences dans les outils de codage IA

Il est vraiment déroutant de constater comment les outils d'IA, tous construits sur le même modèle de langage large de base, peuvent produire des résultats aussi variés. Par exemple, ChatGPT, Perplexity et GitHub Copilot exploitent tous le modèle GPT-4 d'OpenAI. Pourtant, mes tests récents ont montré des différences marquées dans les performances : tandis que ChatGPT et les plans pro de Perplexity ont excellé, GitHub Copilot n'a eu qu'un taux de réussite de 50 %.

J'ai effectué ces tests en utilisant GitHub Copilot intégré dans un environnement VS Code. Je partagerai un guide détaillé sur la configuration de cet environnement dans un prochain article. Pour l'instant, plongeons dans les spécificités des tests que j'ai réalisés.

Si vous êtes curieux de connaître ma méthodologie de test et les invites utilisées, vous pouvez consulter mon guide détaillé sur l'évaluation des capacités de codage d'un chatbot IA.

TL;DR : GitHub Copilot a réussi deux des quatre tests que j'ai effectués.

Test 1 : Écriture d'un plugin WordPress

Ce test a été une complète déception. C'était mon expérience initiale, me laissant incertain si GitHub Copilot a des difficultés avec le codage ou si les contraintes d'interaction dans VS Code limitent ses capacités.

Voici le contexte : j'ai demandé à l'IA de développer un plugin WordPress entièrement fonctionnel incluant une interface d'administration et une logique opérationnelle. La tâche du plugin était d'accepter une liste de noms, de les trier et de séparer les doublons pour éviter leur adjacence.

Cette tâche découlait d'un besoin réel de l'entreprise de commerce électronique de biens numériques de ma femme, où elle gère un groupe Facebook actif.

Alors que cinq des dix modèles d'IA testés ont réussi ce test entièrement, trois ont réussi partiellement, et deux, y compris Microsoft Copilot, ont complètement échoué. GitHub Copilot, bien qu'ayant reçu la même invite, n'a produit que du code PHP. Bien que le problème puisse effectivement être résolu uniquement avec PHP, GitHub Copilot a tenté de référencer JavaScript sans réellement le générer.

Capture d'écran par David Gewirtz/ZDNET

Capture d'écran par David Gewirtz/ZDNET

Lorsque j'ai essayé de pousser GitHub Copilot à partir d'un fichier JavaScript pour compléter la tâche, il a bizarrement répondu avec encore plus de code PHP, tout en référenciant un fichier JavaScript inexistant.

Capture d'écran par David Gewirtz/ZDNET

Capture d'écran par David Gewirtz/ZDNET

Test 2 : Réécriture d'une fonction de chaîne

Ce test était relativement simple : j'ai fourni une fonction destinée à valider les dollars et les cents, mais qui ne vérifiait que les dollars entiers. Le défi était pour l'IA de corriger la fonction.

GitHub Copilot a modifié le code, mais le résultat était problématique. Il supposait que toute chaîne d'entrée était valide, ce qui provoquerait des erreurs si la chaîne était vide. De plus, l'expression régulière mise à jour ne pouvait pas gérer divers cas limites, comme les entrées "3.", ".3" ou "00.30". Pour une fonction destinée à valider une monnaie, de telles négligences sont inacceptables, marquant un autre échec pour GitHub Copilot.

Test 3 : Trouver un bogue agaçant

Ici, GitHub Copilot a brillé. Ce test était basé sur un véritable défi de codage auquel j'ai été confronté, où le message d'erreur ne pointait pas directement vers le problème réel. C'est un peu comme une énigme de codage, nécessitant une compréhension approfondie des appels d'API WordPress pour résoudre.

Alors que Microsoft Copilot, Gemini et Meta Code Llama ont trébuché sur ce test, GitHub Copilot l'a réussi brillamment, démontrant sa capacité à résoudre des problèmes complexes du monde réel.

Test 4 : Écriture d'un script

GitHub Copilot a également réussi ce test, là où Microsoft Copilot a échoué. La tâche impliquait de créer un script qui devait intégrer AppleScript, le modèle d'objet Chrome, et un utilitaire spécifique à Mac appelé Keyboard Maestro.

Pour réussir, l'IA devait reconnaître et gérer les nuances des trois environnements, et GitHub Copilot l'a fait avec brio.

Réflexions finales

Il est décevant de voir GitHub Copilot, qui utilise le modèle avancé GPT-4, échouer la moitié des tests. Étant donné le statut de GitHub en tant que plateforme de gestion de sources de premier plan, on pourrait s'attendre à ce que son support de codage IA soit plus fiable.

Cependant, le monde de l'IA évolue constamment, et je suis optimiste quant à l'amélioration des performances de GitHub Copilot avec le temps. Nous reviendrons sur ce sujet dans quelques mois pour voir comment il a progressé.

Vous fiez-vous à l'IA pour une assistance au codage ? Quel outil IA est votre préféré ? Avez-vous essayé GitHub Copilot ? Partagez vos expériences dans les commentaires ci-dessous.

Restez à jour avec mes progrès quotidiens sur les projets via les réseaux sociaux. N'oubliez pas de vous abonner à ma newsletter hebdomadaire, et suivez-moi sur Twitter/X à @DavidGewirtz, sur Facebook à Facebook.com/DavidGewirtz, sur Instagram à Instagram.com/DavidGewirtz, sur Bluesky à @DavidGewirtz.com, et sur YouTube à YouTube.com/DavidGewirtzTV.

Article connexe
Élevez Vos Images avec HitPaw AI Photo Enhancer : Un Guide Complet Élevez Vos Images avec HitPaw AI Photo Enhancer : Un Guide Complet Voulez-vous transformer votre expérience d'édition de photos ? Grâce à une intelligence artificielle de pointe, améliorer vos images est désormais sans effort. Ce guide détaillé explore le HitPaw AI P
Création musicale alimentée par l'IA : Créez des chansons et des vidéos sans effort Création musicale alimentée par l'IA : Créez des chansons et des vidéos sans effort La création musicale peut être complexe, nécessitant du temps, des ressources et une expertise. L'intelligence artificielle a transformé ce processus, le rendant simple et accessible. Ce guide montre
Création de livres de coloriage alimentés par l'IA : Un guide complet Création de livres de coloriage alimentés par l'IA : Un guide complet Concevoir des livres de coloriage est une entreprise gratifiante, combinant expression artistique et expériences apaisantes pour les utilisateurs. Cependant, le processus peut être laborieux. Heureuse
commentaires (24)
0/200
StephenRoberts
StephenRoberts 13 août 2025 21:01:01 UTC+02:00

GitHub Copilot's AI is such a mixed bag! Sometimes it spits out perfect code, other times it’s like it’s drunk—random errors everywhere. Makes me wonder if the same GPT-4 is just mood-swinging or if the training data’s got some serious split personality. 😅 Anyone else getting whiplash from these AI tools?

WalterWilliams
WalterWilliams 5 août 2025 15:01:00 UTC+02:00

It's wild how GitHub Copilot can be a coding wizard one minute and totally miss the mark the next! 🤯 I tried it for a Python script, and it spat out half-baked code that left me scratching my head. Maybe it’s like a moody artist—brilliant but inconsistent? Anyone else getting these mixed vibes?

WillieLee
WillieLee 29 juillet 2025 14:25:16 UTC+02:00

GitHub Copilot's AI is such a wild card! Sometimes it nails the code, other times it’s like it’s writing poetry instead of Python. 😅 I’m curious, does anyone else feel like they’re rolling dice with these AI tools?

JerryGonzalez
JerryGonzalez 28 juillet 2025 03:19:04 UTC+02:00

GitHub Copilot’s AI is such a mixed bag! Sometimes it’s like having a genius pair-programmer, other times it’s just spitting out buggy code that makes me scratch my head. 😕 Still, it’s wild to think how far AI coding has come, even if it’s not perfect yet.

JuanLewis
JuanLewis 24 avril 2025 01:53:39 UTC+02:00

GitHub Copilot's AI is a mixed bag. Sometimes it nails the code, other times it's like it's guessing. It's baffling how inconsistent it can be. I guess it's still learning, but it's frustrating when you're on a deadline. 🤔

HenryJackson
HenryJackson 23 avril 2025 16:51:43 UTC+02:00

GitHub CopilotのAIは一長一短ですね。時にはコードを完璧に書いてくれるのに、時にはまるで推測しているかのようです。なぜこんなに一貫性がないのか不思議です。まだ学習中なんでしょうが、締め切りがあるときはイライラしますね。🤔

Retour en haut
OR