Option
Heim
Nachricht
Github Copilots KI getestet: Mischkodierer Erfolg lässt mich verblüfft

Github Copilots KI getestet: Mischkodierer Erfolg lässt mich verblüfft

21. April 2025
195

Erforschung der Inkonsistenzen in KI-Coding-Tools

Es ist wirklich rätselhaft, wie KI-Tools, die alle auf demselben grundlegenden großen Sprachmodell basieren, so unterschiedliche Ergebnisse liefern können. Zum Beispiel nutzen ChatGPT, Perplexity und GitHub Copilot alle das GPT-4-Modell von OpenAI. Dennoch zeigten meine jüngsten Tests starke Leistungsunterschiede: Während ChatGPT und die Pro-Pläne von Perplexity hervorragten, hatte GitHub Copilot eine Erfolgsquote von 50 %.

Ich habe diese Tests mit GitHub Copilot durchgeführt, das in eine VS Code-Umgebung integriert war. Ich werde in einem kommenden Artikel eine detaillierte Anleitung zur Einrichtung teilen. Fürs Erste tauchen wir in die Details der von mir durchgeführten Tests ein.

Wenn Sie neugierig auf meine Testmethodik und die verwendeten Prompts sind, können Sie meinen detaillierten Leitfaden zur Bewertung der Programmierfähigkeiten eines KI-Chatbots lesen.

TL;DR: GitHub Copilot hat zwei von den vier durchgeführten Tests bestanden.

Test 1: Erstellung eines WordPress-Plugins

Dieser Test war eine völlige Enttäuschung. Es war mein erster Versuch, und ich war mir unsicher, ob GitHub Copilot Schwierigkeiten mit dem Programmieren hat oder ob die Interaktionsbeschränkungen innerhalb von VS Code seine Fähigkeiten einschränken.

Hier ist der Kontext: Ich habe die KI gebeten, ein voll funktionsfähiges WordPress-Plugin zu entwickeln, das eine Admin-Oberfläche und funktionale Logik enthält. Die Aufgabe des Plugins war es, eine Liste von Namen zu akzeptieren, sie zu sortieren und doppelte Einträge zu trennen, um eine benachbarte Anordnung zu vermeiden.

Diese Aufgabe entstand aus einem realen Bedarf aus dem E-Commerce-Geschäft meiner Frau mit digitalen Gütern, wo sie eine aktive Facebook-Gruppe verwaltet.

Während fünf der zehn getesteten KI-Modelle diesen Test vollständig bestanden, drei teilweise bestanden und zwei, einschließlich Microsoft Copilot, komplett scheiterten, erzeugte GitHub Copilot trotz desselben Prompts nur PHP-Code. Obwohl das Problem tatsächlich allein mit PHP gelöst werden konnte, versuchte GitHub Copilot, auf JavaScript zu verweisen, ohne es tatsächlich zu generieren.

Screenshot von David Gewirtz/ZDNET

Screenshot von David Gewirtz/ZDNET

Als ich versuchte, GitHub Copilot aus einer JavaScript-Datei heraus zu bitten, die Aufgabe zu vervollständigen, antwortete es seltsamerweise mit weiterem PHP-Code, der immer noch auf eine nicht existierende JavaScript-Datei verwies.

Screenshot von David Gewirtz/ZDNET

Screenshot von David Gewirtz/ZDNET

Test 2: Umschreiben einer String-Funktion

Dieser Test war relativ einfach: Ich stellte eine Funktion bereit, die Dollar und Cent validieren sollte, aber nur ganze Dollar überprüfte. Die Herausforderung bestand darin, dass die KI die Funktion korrigiert.

GitHub Copilot hat den Code zwar modifiziert, aber das Ergebnis war problematisch. Es nahm an, dass jeder Eingabestring gültig war, was Fehler verursachen würde, wenn der String leer war. Außerdem konnte der aktualisierte reguläre Ausdruck verschiedene Randfälle nicht handhaben, wie Eingaben wie "3.", ".3" oder "00.30". Für eine Funktion, die Währungen validieren soll, sind solche Versäumnisse inakzeptabel, was einen weiteren Misserfolg für GitHub Copilot markiert.

Test 3: Finden eines lästigen Fehlers

Hier glänzte GitHub Copilot. Dieser Test basierte auf einer echten Programmierherausforderung, die ich hatte, bei der die Fehlermeldung nicht direkt auf das eigentliche Problem hinwies. Es ist ein bisschen wie ein Programmierrätsel, das ein tiefes Verständnis von WordPress-API-Aufrufen erfordert, um gelöst zu werden.

Während Microsoft Copilot, Gemini und Meta Code Llama bei diesem Test scheiterten, meisterte GitHub Copilot ihn und zeigte seine Fähigkeit, komplexe, reale Probleme zu lösen.

Test 4: Erstellung eines Skripts

GitHub Copilot war auch in diesem Test erfolgreich, wo Microsoft Copilot versagte. Die Aufgabe bestand darin, ein Skript zu erstellen, das AppleScript, das Chrome-Objektmodell und ein Mac-spezifisches Dienstprogramm namens Keyboard Maestro integrieren musste.

Um zu bestehen, musste die KI die Nuancen aller drei Umgebungen erkennen und berücksichtigen, und GitHub Copilot hat genau das getan.

Schlussgedanken

Es ist enttäuschend zu sehen, dass GitHub Copilot, das das fortschrittliche GPT-4-Modell verwendet, die Hälfte der Tests nicht bestanden hat. Angesichts des Status von GitHub als führende Quellverwaltungsplattform würde man erwarten, dass die KI-Programmierunterstützung zuverlässiger ist.

Die Welt der KI entwickelt sich jedoch ständig weiter, und ich bin optimistisch, dass die Leistung von GitHub Copilot mit der Zeit verbessert wird. Wir werden in ein paar Monaten darauf zurückkommen, um zu sehen, wie es sich entwickelt hat.

Verlassen Sie sich auf KI für Programmierunterstützung? Welches KI-Tool ist Ihr Favorit? Haben Sie GitHub Copilot ausprobiert? Teilen Sie Ihre Erfahrungen in den Kommentaren unten.

Bleiben Sie mit meinen täglichen Projektfortschritten auf sozialen Medien auf dem Laufenden. Vergessen Sie nicht, sich für meinen wöchentlichen Newsletter anzumelden, und folgen Sie mir auf Twitter/X unter @DavidGewirtz, auf Facebook unter Facebook.com/DavidGewirtz, auf Instagram unter Instagram.com/DavidGewirtz, auf Bluesky unter @DavidGewirtz.com und auf YouTube unter YouTube.com/DavidGewirtzTV.

Verwandter Artikel
Erhöhen Sie die Qualität Ihrer Bilder mit HitPaw AI Photo Enhancer: Ein umfassender Leitfaden Erhöhen Sie die Qualität Ihrer Bilder mit HitPaw AI Photo Enhancer: Ein umfassender Leitfaden Möchten Sie Ihre Bildbearbeitung revolutionieren? Dank modernster künstlicher Intelligenz ist die Verbesserung Ihrer Bilder nun mühelos. Dieser detaillierte Leitfaden stellt den HitPaw AI Photo Enhanc
KI-gestützte Musikerstellung: Songs und Videos mühelos erstellen KI-gestützte Musikerstellung: Songs und Videos mühelos erstellen Musikerstellung kann komplex sein und erfordert Zeit, Ressourcen und Fachwissen. Künstliche Intelligenz hat diesen Prozess revolutioniert und ihn einfach und zugänglich gemacht. Dieser Leitfaden zeigt
Erstellung KI-gestützter Malbücher: Ein umfassender Leitfaden Erstellung KI-gestützter Malbücher: Ein umfassender Leitfaden Das Gestalten von Malbüchern ist ein lohnendes Unterfangen, das künstlerischen Ausdruck mit beruhigenden Erlebnissen für Nutzer verbindet. Der Prozess kann jedoch arbeitsintensiv sein. Glücklicherweis
Kommentare (24)
0/200
StephenRoberts
StephenRoberts 13. August 2025 21:01:01 MESZ

GitHub Copilot's AI is such a mixed bag! Sometimes it spits out perfect code, other times it’s like it’s drunk—random errors everywhere. Makes me wonder if the same GPT-4 is just mood-swinging or if the training data’s got some serious split personality. 😅 Anyone else getting whiplash from these AI tools?

WalterWilliams
WalterWilliams 5. August 2025 15:01:00 MESZ

It's wild how GitHub Copilot can be a coding wizard one minute and totally miss the mark the next! 🤯 I tried it for a Python script, and it spat out half-baked code that left me scratching my head. Maybe it’s like a moody artist—brilliant but inconsistent? Anyone else getting these mixed vibes?

WillieLee
WillieLee 29. Juli 2025 14:25:16 MESZ

GitHub Copilot's AI is such a wild card! Sometimes it nails the code, other times it’s like it’s writing poetry instead of Python. 😅 I’m curious, does anyone else feel like they’re rolling dice with these AI tools?

JerryGonzalez
JerryGonzalez 28. Juli 2025 03:19:04 MESZ

GitHub Copilot’s AI is such a mixed bag! Sometimes it’s like having a genius pair-programmer, other times it’s just spitting out buggy code that makes me scratch my head. 😕 Still, it’s wild to think how far AI coding has come, even if it’s not perfect yet.

JuanLewis
JuanLewis 24. April 2025 01:53:39 MESZ

GitHub Copilot's AI is a mixed bag. Sometimes it nails the code, other times it's like it's guessing. It's baffling how inconsistent it can be. I guess it's still learning, but it's frustrating when you're on a deadline. 🤔

HenryJackson
HenryJackson 23. April 2025 16:51:43 MESZ

GitHub CopilotのAIは一長一短ですね。時にはコードを完璧に書いてくれるのに、時にはまるで推測しているかのようです。なぜこんなに一貫性がないのか不思議です。まだ学習中なんでしょうが、締め切りがあるときはイライラしますね。🤔

Zurück nach oben
OR