Häufige KI-Begriffe, die Sie schon einmal gehört haben – leicht verständlich erklärt

Künstliche Intelligenz verändert unsere Welt grundlegend und schafft dabei ein völlig neues Vokabular, um ihre Funktionsweise zu beschreiben. Wenn Sie sich nur ein paar Minuten mit KI beschäftigen, werden Sie auf Begriffe wie LLMs, RAG, RLHF und Dutzende andere stoßen, die selbst erfahrene Tech-Experten überfordern können. Dieses Glossar ist unser Versuch, diese Sprache zu entmystifizieren. Wir aktualisieren es regelmäßig, sobald sich das Fachgebiet weiterentwickelt – betrachten Sie es also als ein lebendiges Dokument, ähnlich wie die KI-Systeme, die es erklärt.
AGI
Artificial General Intelligence, kurz AGI, ist ein etwas vager Begriff. Im Großen und Ganzen bezieht er sich auf KI, die bei einer Vielzahl von Aufgaben, wenn nicht sogar bei den meisten, leistungsfähiger ist als der durchschnittliche Mensch. OpenAI-CEO Sam Altman beschrieb AGI einmal als das „Äquivalent eines durchschnittlichen Menschen, den man als Kollegen einstellen könnte“. Die Charta von OpenAI definiert AGI hingegen als „hochautonome Systeme, die Menschen bei den meisten wirtschaftlich wertvollen Tätigkeiten übertreffen“. Google DeepMind vertritt eine etwas andere Sichtweise und betrachtet AGI als „KI, die bei den meisten kognitiven Aufgaben mindestens so leistungsfähig ist wie Menschen“. Verwirrt? Keine Sorge – Experten an der Spitze der KI-Forschung sind es oft auch.
KI-Agent
Ein KI-Agent ist ein Tool, das KI nutzt, um eine Abfolge von Aufgaben autonom in Ihrem Namen auszuführen. Er geht über die Fähigkeiten eines einfachen Chatbots hinaus und übernimmt Aufgaben wie die Erfassung von Spesen, die Buchung von Reisen oder Restaurantreservierungen oder sogar das Schreiben und Pflegen von Code. Wie bereits erwähnt, handelt es sich jedoch um ein aufstrebendes Feld mit vielen sich entwickelnden Aspekten, sodass der Begriff „KI-Agent“ für verschiedene Menschen unterschiedliche Bedeutungen haben kann. Die erforderliche Infrastruktur zur vollständigen Umsetzung der angestrebten Fähigkeiten befindet sich noch in der Entwicklung. Im Kern impliziert das Konzept ein autonomes System, das mehrere KI-Modelle nutzen kann, um mehrstufige Aufgaben auszuführen.
API-Endpunkte
Stellen Sie sich API-Endpunkte als „Schaltflächen“ auf der Rückseite einer Softwareanwendung vor, die andere Programme betätigen können, um bestimmte Aktionen auszulösen. Entwickler nutzen diese Schnittstellen, um Integrationen zu erstellen – beispielsweise damit eine App Daten aus einer anderen abrufen kann oder damit ein KI-Agent Dienste von Drittanbietern direkt und ohne manuelle Eingriffe steuern kann. Die meisten Smart-Home-Geräte und vernetzten Plattformen verfügen über diese versteckten Schaltflächen, auch wenn normale Nutzer sie nie sehen oder mit ihnen interagieren. Da KI-Agenten immer ausgefeilter werden, sind sie zunehmend in der Lage, diese Endpunkte selbstständig zu entdecken und zu nutzen, was leistungsstarke – und manchmal überraschende – Möglichkeiten für die Automatisierung eröffnet.
Gedankengang
Bei einer einfachen Frage kann das menschliche Gehirn oft ohne viel bewusstes Nachdenken antworten – Fragen wie: „Welches Tier ist größer, eine Giraffe oder eine Katze?“ Bei komplexeren Problemen benötigen Sie jedoch möglicherweise Stift und Papier, um die Zwischenschritte durchzuarbeiten. Wenn ein Landwirt beispielsweise Hühner und Kühe mit insgesamt 40 Köpfen und 120 Beinen hat, würden Sie wahrscheinlich eine einfache Gleichung aufstellen, um die Antwort zu finden (20 Hühner und 20 Kühe).
In der KI beinhaltet das Ketten-der-Gedanken-Denken bei großen Sprachmodellen die Aufteilung eines Problems in kleinere Zwischenschritte, um die Genauigkeit des Endergebnisses zu verbessern. Dieser Ansatz benötigt in der Regel länger, um eine Antwort zu liefern, aber das Ergebnis ist mit größerer Wahrscheinlichkeit korrekt, insbesondere in logischen oder programmiertechnischen Kontexten. Schlussfolgerungsmodelle werden aus traditionellen LLMs entwickelt und durch Techniken wie verstärktes Lernen für dieses schrittweise Denken optimiert.
(Siehe: Großes Sprachmodell)
Dies ist ein spezifischeres Konzept als ein allgemeiner „KI-Agent“. Ein Programmieragent ist ein spezialisiertes Programm, das autonom schrittweise Aktionen ausführen kann, um ein Ziel der Softwareentwicklung zu erreichen. Anstatt lediglich Code vorzuschlagen, den ein Mensch überprüfen und einfügen muss, kann ein Programmieragent Code selbstständig schreiben, testen und debuggen und so die iterative Trial-and-Error-Arbeit übernehmen, die normalerweise den Tag eines Entwicklers ausfüllt. Diese Agenten können über gesamte Codebasen hinweg arbeiten, Fehler identifizieren, Tests durchführen und Korrekturen mit minimaler menschlicher Aufsicht bereitstellen. Stellen Sie sich das so vor, als würden Sie einen unglaublich schnellen Praktikanten einstellen, der niemals schläft oder die Konzentration verliert – allerdings muss, wie bei jedem Praktikanten, ein Mensch die endgültige Arbeit noch überprüfen.
Rechenleistung
Obwohl der Begriff mehrere Bedeutungen haben kann, bezieht sich „Rechenleistung“ im Allgemeinen auf die grundlegende Rechenleistung, die für das Funktionieren von KI-Modellen erforderlich ist. Diese Verarbeitungsleistung treibt die KI-Branche an und ermöglicht das Training und den Einsatz leistungsstarker Modelle. Der Begriff ist oft eine Kurzform für die Hardware, die diese Leistung bereitstellt – Komponenten wie GPUs, CPUs, TPUs und andere Infrastruktur, die die Grundlage des modernen KI-Ökosystems bildet.
Deep Learning
Ein Teilbereich des sich selbst verbessernden maschinellen Lernens, bei dem KI-Algorithmen mit einer mehrschichtigen Struktur aus künstlichen neuronalen Netzen (ANN) aufgebaut sind. Dies ermöglicht es ihnen, komplexere Muster und Zusammenhänge zu erkennen als einfachere maschinelle Lernsysteme, wie lineare Modelle oder Entscheidungsbäume. Das Design von Deep-Learning-Algorithmen ist vom miteinander verbundenen Netzwerk von Neuronen im menschlichen Gehirn inspiriert.
Deep-Learning-Modelle können wichtige Merkmale in Daten selbstständig identifizieren, ohne dass menschliche Ingenieure diese Merkmale vorab definieren müssen. Diese Struktur unterstützt auch Algorithmen, die aus Fehlern lernen und durch Wiederholung und Anpassung ihre Ergebnisse im Laufe der Zeit verbessern. Deep-Learning-Systeme benötigen jedoch riesige Datenmengen (Millionen von Datenpunkten oder mehr), um gute Ergebnisse zu liefern. Außerdem dauert ihr Training in der Regel länger als bei einfacheren Algorithmen des maschinellen Lernens, was zu höheren Entwicklungskosten führt.
(Siehe: Neuronales Netzwerk)
Diffusion
Diffusion ist die Kerntechnologie hinter vielen KI-Modellen, die Kunst, Musik und Text generieren. Inspiriert von der Physik „zerstören“ Diffusionssysteme schrittweise die Struktur von Daten – wie Fotos oder Lieder –, indem sie Rauschen hinzufügen, bis nichts Erkennbares mehr übrig bleibt. In der Physik ist Diffusion spontan und irreversibel (in Kaffee aufgelöster Zucker kann nicht wieder in Würfelform zurückkehren). KI-Diffusionssysteme zielen jedoch darauf ab, einen „umgekehrten Diffusionsprozess“ zu erlernen, um die Originaldaten aus dem Rauschen zu rekonstruieren und so die Fähigkeit zu erlangen, neue Daten von Grund auf zu generieren.
Destillation
Destillation ist eine Technik zur Übertragung von Wissen von einem großen KI-Modell (dem „Lehrer“) auf ein kleineres (den „Schüler“). Entwickler senden Abfragen an das Lehrermodell und zeichnen dessen Ausgaben auf, wobei sie diese manchmal mit einem Datensatz vergleichen, um die Genauigkeit zu bewerten. Diese Ausgaben werden dann verwendet, um das Schülermodell so zu trainieren, dass es das Verhalten des Lehrers annähernd nachahmt.
Durch Destillation kann auf Basis eines größeren Modells ein kleineres, effizienteres Modell mit minimalem Leistungsverlust erstellt werden. Auf diese Weise hat OpenAI wahrscheinlich GPT-4 Turbo entwickelt, eine schnellere Version von GPT-4.
Zwar nutzen alle KI-Unternehmen die Destillation intern, doch einige haben sie möglicherweise auch eingesetzt, um zu führenden Modellen aufzuschließen. Die Destillation von Wissen aus dem Modell eines Mitbewerbers verstößt jedoch in der Regel gegen die Nutzungsbedingungen für KI-APIs und Chat-Assistenten.
Feintuning
Dies bezieht sich auf das zusätzliche Training eines KI-Modells, um dessen Leistung für eine bestimmte Aufgabe oder einen bestimmten Bereich über den ursprünglichen Trainingsschwerpunkt hinaus zu optimieren. Dies geschieht in der Regel, indem dem Modell neue, spezialisierte Daten zugeführt werden, die für den Zielbereich relevant sind.
Viele KI-Startups beginnen mit einem großen Sprachmodell als Grundlage für ein kommerzielles Produkt. Anschließend versuchen sie, dessen Nutzen für einen bestimmten Sektor oder eine bestimmte Aufgabe zu verbessern, indem sie es mit ihrem eigenen domänenspezifischen Wissen und ihrer Expertise feinabstimmen und so die früheren Trainingszyklen des Modells ergänzen.
(Siehe: Großes Sprachmodell [LLM])
GAN
Ein Generative Adversarial Network (GAN) ist eine Art von Framework für maschinelles Lernen, das bedeutende Fortschritte in der generativen KI vorangetrieben hat, insbesondere bei der Erstellung realistischer Daten – einschließlich Tools für Deepfakes. Bei GANs arbeiten zwei neuronale Netze gegeneinander: Das eine (der Generator) erzeugt auf der Grundlage seiner Trainingsdaten eine Ausgabe, und das andere (der Diskriminator) bewertet diese Ausgabe.
Die beiden Modelle sind im Wesentlichen auf einen Wettstreit programmiert. Der Generator versucht, Ergebnisse zu erzeugen, die überzeugend genug sind, um den Diskriminator zu täuschen, während der Diskriminator daran arbeitet, künstlich erzeugte Daten zu erkennen. Dieser gegensätzliche Prozess kann KI-Ergebnisse optimieren, sodass sie realistischer werden, ohne dass zusätzlicher menschlicher Eingriff erforderlich ist. GANs sind am effektivsten für eng gefasste Anwendungen, wie das Erzeugen realistischer Fotos oder Videos, und weniger für allgemeine KI-Zwecke.
Halluzination
Halluzination ist der Begriff der KI-Branche für den Fall, dass Modelle falsche oder erfundene Informationen generieren. Dies stellt eine große Herausforderung für die Qualität und Zuverlässigkeit von KI dar.
Halluzinationen können zu irreführenden generativen KI-Ergebnissen führen, die potenzielle Risiken in der realen Welt bergen – wie beispielsweise schädliche medizinische Ratschläge bei einer Gesundheitsanfrage.
Es wird angenommen, dass dieses Problem der KI-Erfindung auf Lücken in den Trainingsdaten zurückzuführen ist. Die Verbreitung von Halluzinationen treibt einen Trend hin zu spezialisierteren, vertikalen KI-Modellen voran – domänenspezifische Systeme mit engerem Fachwissen –, um Wissenslücken zu schließen und das Risiko von Desinformation zu minimieren.
Inferenz
Inferenz ist der Prozess, bei dem ein trainiertes KI-Modell ausgeführt wird, um Vorhersagen zu treffen oder Schlussfolgerungen aus neuen Daten zu ziehen. Es ist wichtig zu beachten, dass Inferenz nicht ohne vorheriges Training stattfinden kann; ein Modell muss zunächst Muster aus einem Datensatz lernen, bevor es dieses Wissen effektiv extrapolieren kann.
Viele Arten von Hardware können Inferenz durchführen, von Smartphone-Prozessoren über leistungsstarke GPUs bis hin zu speziellen KI-Beschleunigern. Allerdings ist nicht jede Hardware gleichermaßen leistungsfähig. Sehr große Modelle würden auf einem Standard-Laptop im Vergleich zu einem mit High-End-KI-Chips ausgestatteten Cloud-Server unpraktisch lange laufen.
[Siehe: Training]
Große Sprachmodelle (LLM)
Große Sprachmodelle (LLMs) sind die KI-Modelle, die beliebte Assistenten wie ChatGPT, Claude, Googles Gemini, Metas Llama, Microsoft Copilot und Mistrals Le Chat antreiben. Wenn Sie mit einem KI-Assistenten interagieren, kommunizieren Sie mit einem LLM, das Ihre Anfrage direkt oder mit Hilfe verschiedener Tools wie Webbrowsing oder Code-Interpretern verarbeitet.
LLMs sind tiefe neuronale Netze, die aus Milliarden von numerischen Parametern (oder Gewichten) bestehen und die Beziehungen zwischen Wörtern und Phrasen lernen, wodurch eine mehrdimensionale Darstellung der Sprache entsteht – eine Art linguistische Karte.
Diese Modelle werden durch die Analyse von Mustern in Milliarden von Büchern, Artikeln und Transkripten trainiert. Wenn Sie eine Eingabe an ein LLM senden, generiert es das wahrscheinlichste sprachliche Muster, das zu Ihrer Eingabe passt.
(Siehe: Neuronales Netzwerk)
Speicher-Cache
Speicher-Cache bezeichnet einen Prozess, der die Inferenz (die Generierung von Antworten durch die KI) verbessert. Im Wesentlichen ist Caching eine Optimierungstechnik, die darauf abzielt, die Inferenz effizienter zu gestalten. KI stützt sich auf intensive mathematische Berechnungen, die jeweils Rechenleistung verbrauchen. Caching reduziert die Anzahl der Berechnungen, die ein Modell durchführen muss, indem bestimmte Berechnungen zur Wiederverwendung bei zukünftigen Abfragen gespeichert werden. Es gibt verschiedene Arten des Speicher-Cachings, wobei KV-Caching (Key-Value) ein bekanntes Beispiel für Transformer-basierte Modelle ist. KV-Caching erhöht die Effizienz und beschleunigt die Antworten, indem es die Zeit und den Rechenaufwand reduziert, die zur Generierung von Antworten benötigt werden.
(Siehe: Inferenz)
Neuronales Netzwerk
Ein neuronales Netzwerk ist die mehrschichtige algorithmische Struktur, die Deep Learning und, im weiteren Sinne, den Boom der generativen KI nach dem Aufkommen großer Sprachmodelle untermauert.
Obwohl die Idee, sich bei der Entwicklung von Datenverarbeitungsalgorithmen von den miteinander verbundenen Neuronen des menschlichen Gehirns inspirieren zu lassen, bereits in die 1940er Jahre zurückreicht, war es die jüngste Verbreitung von Grafikprozessoren (GPUs) – vorangetrieben durch die Videospielindustrie –, die das Potenzial dieser Theorie erst wirklich erschloss. Diese Chips erwiesen sich als außerordentlich gut geeignet für das Training von Algorithmen mit weitaus mehr Schichten, als zuvor möglich war, wodurch KI-Systeme auf Basis neuronaler Netze in Bereichen wie Spracherkennung, autonome Navigation und Wirkstoffforschung eine überragende Leistung erzielen konnten.
(Siehe: Large Language Model [LLM])
Open Source
Open Source bezieht sich auf Software – oder zunehmend auch auf KI-Modelle –, deren zugrunde liegender Code öffentlich zugänglich ist, sodass jeder ihn nutzen, einsehen oder ändern kann. Im Bereich der KI ist die Llama-Modellfamilie von Meta ein prominentes Beispiel; bei Betriebssystemen ist Linux die klassische historische Entsprechung. Der Open-Source-Ansatz ermöglicht es Forschern, Entwicklern und Unternehmen weltweit, auf der Arbeit anderer aufzubauen, was den Fortschritt beschleunigt und unabhängige Sicherheitsprüfungen ermöglicht, die geschlossene Systeme nicht ohne Weiteres bieten können. Closed Source bedeutet, dass der Code privat ist – man kann das Produkt nutzen, aber nicht sehen, wie es funktioniert, wie bei den GPT-Modellen von OpenAI. Diese Unterscheidung ist zu einer zentralen Debatte innerhalb der KI-Branche geworden.
Parallelisierung
Parallelisierung bedeutet, viele Operationen gleichzeitig statt nacheinander auszuführen – so als würden zehn Mitarbeiter gleichzeitig an verschiedenen Teilen eines Projekts arbeiten, anstatt dass eine Person alles Schritt für Schritt erledigt. In der KI ist Parallelisierung sowohl für das Training als auch für die Inferenz von grundlegender Bedeutung. Moderne GPUs sind speziell darauf ausgelegt, Tausende von Berechnungen parallel durchzuführen – ein Hauptgrund dafür, dass sie zum Hardware-Rückgrat der Branche geworden sind. Da KI-Systeme immer komplexer und Modelle immer größer werden, ist die Fähigkeit, die Arbeit über viele Chips und Maschinen hinweg zu parallelisieren, zu einem entscheidenden Faktor geworden, der bestimmt, wie schnell und kosteneffizient Modelle erstellt und bereitgestellt werden können. Die Erforschung besserer Parallelisierungsstrategien ist mittlerweile ein eigenständiges Forschungsgebiet.
RAMageddon
RAMageddon ist der scherzhafte neue Begriff für einen ernsten Trend, der die Tech-Branche erfasst: eine zunehmende Verknappung von RAM-Chips (Random Access Memory), die fast alle technischen Produkte antreiben, die wir täglich nutzen. Da die KI-Branche explosionsartig gewachsen ist, kaufen große Tech-Unternehmen und KI-Labore – die alle darum konkurrieren, die leistungsstärkste und effizienteste KI zu entwickeln – so große Mengen an RAM für ihre Rechenzentren, dass für andere kaum noch etwas übrig bleibt. Dieser Lieferengpass treibt die Preise für die verbleibenden Bestände in die Höhe.
Die Auswirkungen erstrecken sich auf Branchen wie Gaming (wo Unternehmen die Preise für Spielkonsolen aufgrund der Knappheit an Speicherchips erhöht haben), Unterhaltungselektronik (wo Engpässe den größten Einbruch bei den Smartphone-Lieferungen seit über einem Jahrzehnt verursachen könnten) und den allgemeinen Unternehmens-IT-Bereich (da Unternehmen Schwierigkeiten haben, genügend RAM für ihre eigenen Rechenzentren zu beschaffen). Es wird erwartet, dass die Preisanstiege so lange anhalten, bis die Knappheit endet, doch leider gibt es kaum Anzeichen dafür, dass dies bald geschehen wird.
Verstärkendes Lernen
Verstärkendes Lernen ist eine Trainingsmethode, bei der ein KI-System durch Versuch und Irrtum lernt und für richtige Handlungen Belohnungen erhält – ähnlich wie beim Training eines Haustiers mit Leckerlis, nur dass das „Haustier“ ein neuronales Netzwerk und das „Leckerli“ ein mathematisches Signal ist, das Erfolg anzeigt. Im Gegensatz zum überwachten Lernen, bei dem ein Modell anhand eines festen Datensatzes mit beschrifteten Beispielen trainiert wird, ermöglicht das verstärkende Lernen einem Modell, seine Umgebung zu erkunden, Handlungen auszuführen und sein Verhalten auf der Grundlage von Feedback kontinuierlich anzupassen. Dieser Ansatz hat sich als besonders effektiv erwiesen, um KI darauf zu trainieren, Spiele zu spielen, Roboter zu steuern und in jüngerer Zeit die Schlussfolgerungsfähigkeiten großer Sprachmodelle zu schärfen. Techniken wie das verstärkende Lernen aus menschlichem Feedback (RLHF) spielen mittlerweile eine zentrale Rolle dabei, wie führende KI-Labore ihre Modelle so verfeinern, dass sie hilfreicher, genauer und sicherer werden.
Token
Die Mensch-Maschine-Kommunikation birgt offensichtliche Herausforderungen: Menschen verwenden menschliche Sprache, während KI-Programme Aufgaben durch komplexe, datengestützte algorithmische Prozesse ausführen. Token überbrücken diese Kluft. Sie sind die grundlegenden Bausteine der Mensch-KI-Kommunikation und repräsentieren diskrete Datensegmente, die von einem LLM verarbeitet oder erzeugt werden. Sie entstehen durch Tokenisierung, bei der Rohtext in verarbeitbare Einheiten zerlegt wird, die ein Sprachmodell verstehen kann – ähnlich wie ein Compiler menschliche Sprache in Binärcode für einen Computer übersetzt. Im Unternehmenskontext bestimmen Token auch die Kosten – die meisten KI-Unternehmen berechnen die Nutzung von LLMs auf Token-Basis, was bedeutet: Je mehr ein Unternehmen nutzt, desto mehr zahlt es.
Token-Durchsatz
Noch einmal: Token sind die kleinen Textbausteine – oft Teile von Wörtern –, in die KI-Sprachmodelle Sprache zur Verarbeitung zerlegen; sie sind in etwa mit „Wörtern“ vergleichbar, um KI-Workloads zu verstehen. Durchsatz bezieht sich darauf, wie viel in einer bestimmten Zeit verarbeitet werden kann, sodass der Token-Durchsatz im Wesentlichen misst, wie viel KI-Arbeit ein System gleichzeitig bewältigen kann. Ein hoher Token-Durchsatz ist ein zentrales Ziel für KI-Infrastrukturteams, da er bestimmt, wie viele Nutzer ein Modell gleichzeitig bedienen kann und wie schnell jeder eine Antwort erhält. Der KI-Forscher Andrej Karpathy hat beschrieben, dass er sich unwohl fühlt, wenn seine KI-Abonnements ungenutzt bleiben – was seine Sorge aus der Studienzeit über ungenutzte teure Hardware widerspiegelt –, ein Gefühl, das verdeutlicht, warum die Maximierung des Token-Durchsatzes in der Branche zu einer Obsession geworden ist.
Training
Die Entwicklung von KI im Bereich des maschinellen Lernens umfasst einen Prozess, der als Training bezeichnet wird. Einfach ausgedrückt bedeutet dies, dass Daten in ein Modell eingespeist werden, damit es Muster lernen und nützliche Ergebnisse generieren kann. Es ist der Prozess, durch den das System auf Merkmale in den Daten reagiert und seine Ergebnisse an ein gewünschtes Ziel anpasst – sei es das Erkennen von Katzenbildern oder das Verfassen eines Haikus auf Abruf.
Das Training kann kostspielig sein, da es riesige Datenmengen erfordert, und der Bedarf an Daten steigt weiter an. Aus diesem Grund können hybride Ansätze, wie die Feinabstimmung einer regelbasierten KI mit gezielten Daten, dabei helfen, die Kosten zu kontrollieren, ohne bei Null anfangen zu müssen.
[Siehe: Inferenz]
Transferlernen
Eine Technik, bei der ein vortrainiertes KI-Modell als Ausgangspunkt für die Entwicklung eines neuen Modells für eine andere, aber in der Regel verwandte Aufgabe dient. Dadurch können die aus früheren Trainingszyklen gewonnenen Erkenntnisse wiederverwendet werden.
Transferlernen kann die Effizienz steigern, indem es die Modellentwicklung verkürzt. Es ist auch nützlich, wenn die Daten für die neue Aufgabe begrenzt sind. Der Ansatz hat jedoch Einschränkungen. Modelle, die sich für allgemeine Fähigkeiten auf Transferlernen stützen, erfordern wahrscheinlich zusätzliches Training mit domänenspezifischen Daten, um in ihrem Schwerpunktbereich gute Leistungen zu erbringen.
(Siehe: Feinabstimmung)
Gewichte
Gewichte spielen eine zentrale Rolle beim KI-Training, da sie die Bedeutung (oder das „Gewicht“) bestimmen, die verschiedenen Merkmalen (oder Eingabevariablen) in den Trainingsdaten zugewiesen wird, und so die Ausgabe des Modells beeinflussen.
Mit anderen Worten: Gewichte sind numerische Parameter, die definieren, was in einem Datensatz für eine bestimmte Trainingsaufgabe am wichtigsten ist. Sie wirken durch die Multiplikation der Eingaben. Das Modelltraining beginnt in der Regel mit zufällig zugewiesenen Gewichten, die sich im Laufe der Iterationen des Modells anpassen, um Ausgaben zu erzeugen, die dem Ziel besser entsprechen.
Beispielsweise könnte ein KI-Modell, das anhand historischer Immobiliendaten trainiert wurde, um Immobilienpreise vorherzusagen, Gewichte für Merkmale wie die Anzahl der Schlaf- und Badezimmer, die Art der Immobilie (Einfamilien- oder Doppelhaushälfte), die Verfügbarkeit von Parkplätzen, eine Garage usw. haben. Die Gewichte, die das Modell jeder Eingabe zuweist, spiegeln deren Einfluss auf den Immobilienwert auf der Grundlage des Datensatzes wider.
Validierungsverlust
Der Validierungsverlust ist eine Metrik, die angibt, wie gut ein KI-Modell während des Trainings lernt – niedrigere Werte sind besser. Forscher überwachen ihn genau als eine Art Echtzeit-Zeugnis und nutzen ihn, um zu entscheiden, wann das Training beendet, Hyperparameter angepasst oder potenzielle Probleme untersucht werden sollten. Ein wichtiges Problem, das er aufzeigt, ist das Überanpassen (Overfitting) – ein Zustand, bei dem ein Modell seine Trainingsdaten auswendig lernt, anstatt verallgemeinerbare Muster zu erlernen. Stellen Sie sich das als den Unterschied zwischen einem Schüler vor, der den Stoff wirklich versteht, und einem, der lediglich die Prüfung vom letzten Jahr auswendig gelernt hat – der Validierungsverlust hilft dabei, aufzudecken, welchen Weg Ihr Modell einschlägt.
Dieser Artikel wird regelmäßig mit neuen Informationen aktualisiert.
Verwandter Artikel
Das Softwareunternehmen Intrinsic Robotics fusioniert unter dem Dach von Alphabet mit Google
Google baut seine Präsenz im Bereich der physischen KI durch die Integration einer bekannten Robotik-Softwareplattform aus.Intrinsic, ein Unternehmen von Alphabet, das KI-Modelle und Software entwicke
Apples Zukunft im Hardware-Bereich: Ternus übernimmt das Ruder
Da Apple bestrebt ist, seinen Wettbewerbsvorteil im Bereich der künstlichen Intelligenz zu wahren und gleichzeitig mit Zöllen und Instabilitäten in der Lieferkette zu kämpfen hat, steht dem Unternehme
Die FIFA startet mit KI einen Neustart des weltweiten Fußballs – beginnend bei der Weltmeisterschaft
Als Romy Gai, Chief Business Officer der FIFA, die operativen Herausforderungen bei der Ausrichtung einer Weltmeisterschaft mit 48 Mannschaften in Kanada, Mexiko und den Vereinigten Staaten skizzierte
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Künstliche Intelligenz verändert unsere Welt grundlegend und schafft dabei ein völlig neues Vokabular, um ihre Funktionsweise zu beschreiben. Wenn Sie sich nur ein paar Minuten mit KI beschäftigen, werden Sie auf Begriffe wie LLMs, RAG, RLHF und Dutzende andere stoßen, die selbst erfahrene Tech-Experten überfordern können. Dieses Glossar ist unser Versuch, diese Sprache zu entmystifizieren. Wir aktualisieren es regelmäßig, sobald sich das Fachgebiet weiterentwickelt – betrachten Sie es also als ein lebendiges Dokument, ähnlich wie die KI-Systeme, die es erklärt.
AGI
Artificial General Intelligence, kurz AGI, ist ein etwas vager Begriff. Im Großen und Ganzen bezieht er sich auf KI, die bei einer Vielzahl von Aufgaben, wenn nicht sogar bei den meisten, leistungsfähiger ist als der durchschnittliche Mensch. OpenAI-CEO Sam Altman beschrieb AGI einmal als das „Äquivalent eines durchschnittlichen Menschen, den man als Kollegen einstellen könnte“. Die Charta von OpenAI definiert AGI hingegen als „hochautonome Systeme, die Menschen bei den meisten wirtschaftlich wertvollen Tätigkeiten übertreffen“. Google DeepMind vertritt eine etwas andere Sichtweise und betrachtet AGI als „KI, die bei den meisten kognitiven Aufgaben mindestens so leistungsfähig ist wie Menschen“. Verwirrt? Keine Sorge – Experten an der Spitze der KI-Forschung sind es oft auch.
KI-Agent
Ein KI-Agent ist ein Tool, das KI nutzt, um eine Abfolge von Aufgaben autonom in Ihrem Namen auszuführen. Er geht über die Fähigkeiten eines einfachen Chatbots hinaus und übernimmt Aufgaben wie die Erfassung von Spesen, die Buchung von Reisen oder Restaurantreservierungen oder sogar das Schreiben und Pflegen von Code. Wie bereits erwähnt, handelt es sich jedoch um ein aufstrebendes Feld mit vielen sich entwickelnden Aspekten, sodass der Begriff „KI-Agent“ für verschiedene Menschen unterschiedliche Bedeutungen haben kann. Die erforderliche Infrastruktur zur vollständigen Umsetzung der angestrebten Fähigkeiten befindet sich noch in der Entwicklung. Im Kern impliziert das Konzept ein autonomes System, das mehrere KI-Modelle nutzen kann, um mehrstufige Aufgaben auszuführen.
API-Endpunkte
Stellen Sie sich API-Endpunkte als „Schaltflächen“ auf der Rückseite einer Softwareanwendung vor, die andere Programme betätigen können, um bestimmte Aktionen auszulösen. Entwickler nutzen diese Schnittstellen, um Integrationen zu erstellen – beispielsweise damit eine App Daten aus einer anderen abrufen kann oder damit ein KI-Agent Dienste von Drittanbietern direkt und ohne manuelle Eingriffe steuern kann. Die meisten Smart-Home-Geräte und vernetzten Plattformen verfügen über diese versteckten Schaltflächen, auch wenn normale Nutzer sie nie sehen oder mit ihnen interagieren. Da KI-Agenten immer ausgefeilter werden, sind sie zunehmend in der Lage, diese Endpunkte selbstständig zu entdecken und zu nutzen, was leistungsstarke – und manchmal überraschende – Möglichkeiten für die Automatisierung eröffnet.
Gedankengang
Bei einer einfachen Frage kann das menschliche Gehirn oft ohne viel bewusstes Nachdenken antworten – Fragen wie: „Welches Tier ist größer, eine Giraffe oder eine Katze?“ Bei komplexeren Problemen benötigen Sie jedoch möglicherweise Stift und Papier, um die Zwischenschritte durchzuarbeiten. Wenn ein Landwirt beispielsweise Hühner und Kühe mit insgesamt 40 Köpfen und 120 Beinen hat, würden Sie wahrscheinlich eine einfache Gleichung aufstellen, um die Antwort zu finden (20 Hühner und 20 Kühe).
In der KI beinhaltet das Ketten-der-Gedanken-Denken bei großen Sprachmodellen die Aufteilung eines Problems in kleinere Zwischenschritte, um die Genauigkeit des Endergebnisses zu verbessern. Dieser Ansatz benötigt in der Regel länger, um eine Antwort zu liefern, aber das Ergebnis ist mit größerer Wahrscheinlichkeit korrekt, insbesondere in logischen oder programmiertechnischen Kontexten. Schlussfolgerungsmodelle werden aus traditionellen LLMs entwickelt und durch Techniken wie verstärktes Lernen für dieses schrittweise Denken optimiert.
(Siehe: Großes Sprachmodell)
Dies ist ein spezifischeres Konzept als ein allgemeiner „KI-Agent“. Ein Programmieragent ist ein spezialisiertes Programm, das autonom schrittweise Aktionen ausführen kann, um ein Ziel der Softwareentwicklung zu erreichen. Anstatt lediglich Code vorzuschlagen, den ein Mensch überprüfen und einfügen muss, kann ein Programmieragent Code selbstständig schreiben, testen und debuggen und so die iterative Trial-and-Error-Arbeit übernehmen, die normalerweise den Tag eines Entwicklers ausfüllt. Diese Agenten können über gesamte Codebasen hinweg arbeiten, Fehler identifizieren, Tests durchführen und Korrekturen mit minimaler menschlicher Aufsicht bereitstellen. Stellen Sie sich das so vor, als würden Sie einen unglaublich schnellen Praktikanten einstellen, der niemals schläft oder die Konzentration verliert – allerdings muss, wie bei jedem Praktikanten, ein Mensch die endgültige Arbeit noch überprüfen.
Rechenleistung
Obwohl der Begriff mehrere Bedeutungen haben kann, bezieht sich „Rechenleistung“ im Allgemeinen auf die grundlegende Rechenleistung, die für das Funktionieren von KI-Modellen erforderlich ist. Diese Verarbeitungsleistung treibt die KI-Branche an und ermöglicht das Training und den Einsatz leistungsstarker Modelle. Der Begriff ist oft eine Kurzform für die Hardware, die diese Leistung bereitstellt – Komponenten wie GPUs, CPUs, TPUs und andere Infrastruktur, die die Grundlage des modernen KI-Ökosystems bildet.
Deep Learning
Ein Teilbereich des sich selbst verbessernden maschinellen Lernens, bei dem KI-Algorithmen mit einer mehrschichtigen Struktur aus künstlichen neuronalen Netzen (ANN) aufgebaut sind. Dies ermöglicht es ihnen, komplexere Muster und Zusammenhänge zu erkennen als einfachere maschinelle Lernsysteme, wie lineare Modelle oder Entscheidungsbäume. Das Design von Deep-Learning-Algorithmen ist vom miteinander verbundenen Netzwerk von Neuronen im menschlichen Gehirn inspiriert.
Deep-Learning-Modelle können wichtige Merkmale in Daten selbstständig identifizieren, ohne dass menschliche Ingenieure diese Merkmale vorab definieren müssen. Diese Struktur unterstützt auch Algorithmen, die aus Fehlern lernen und durch Wiederholung und Anpassung ihre Ergebnisse im Laufe der Zeit verbessern. Deep-Learning-Systeme benötigen jedoch riesige Datenmengen (Millionen von Datenpunkten oder mehr), um gute Ergebnisse zu liefern. Außerdem dauert ihr Training in der Regel länger als bei einfacheren Algorithmen des maschinellen Lernens, was zu höheren Entwicklungskosten führt.
(Siehe: Neuronales Netzwerk)
Diffusion
Diffusion ist die Kerntechnologie hinter vielen KI-Modellen, die Kunst, Musik und Text generieren. Inspiriert von der Physik „zerstören“ Diffusionssysteme schrittweise die Struktur von Daten – wie Fotos oder Lieder –, indem sie Rauschen hinzufügen, bis nichts Erkennbares mehr übrig bleibt. In der Physik ist Diffusion spontan und irreversibel (in Kaffee aufgelöster Zucker kann nicht wieder in Würfelform zurückkehren). KI-Diffusionssysteme zielen jedoch darauf ab, einen „umgekehrten Diffusionsprozess“ zu erlernen, um die Originaldaten aus dem Rauschen zu rekonstruieren und so die Fähigkeit zu erlangen, neue Daten von Grund auf zu generieren.
Destillation
Destillation ist eine Technik zur Übertragung von Wissen von einem großen KI-Modell (dem „Lehrer“) auf ein kleineres (den „Schüler“). Entwickler senden Abfragen an das Lehrermodell und zeichnen dessen Ausgaben auf, wobei sie diese manchmal mit einem Datensatz vergleichen, um die Genauigkeit zu bewerten. Diese Ausgaben werden dann verwendet, um das Schülermodell so zu trainieren, dass es das Verhalten des Lehrers annähernd nachahmt.
Durch Destillation kann auf Basis eines größeren Modells ein kleineres, effizienteres Modell mit minimalem Leistungsverlust erstellt werden. Auf diese Weise hat OpenAI wahrscheinlich GPT-4 Turbo entwickelt, eine schnellere Version von GPT-4.
Zwar nutzen alle KI-Unternehmen die Destillation intern, doch einige haben sie möglicherweise auch eingesetzt, um zu führenden Modellen aufzuschließen. Die Destillation von Wissen aus dem Modell eines Mitbewerbers verstößt jedoch in der Regel gegen die Nutzungsbedingungen für KI-APIs und Chat-Assistenten.
Feintuning
Dies bezieht sich auf das zusätzliche Training eines KI-Modells, um dessen Leistung für eine bestimmte Aufgabe oder einen bestimmten Bereich über den ursprünglichen Trainingsschwerpunkt hinaus zu optimieren. Dies geschieht in der Regel, indem dem Modell neue, spezialisierte Daten zugeführt werden, die für den Zielbereich relevant sind.
Viele KI-Startups beginnen mit einem großen Sprachmodell als Grundlage für ein kommerzielles Produkt. Anschließend versuchen sie, dessen Nutzen für einen bestimmten Sektor oder eine bestimmte Aufgabe zu verbessern, indem sie es mit ihrem eigenen domänenspezifischen Wissen und ihrer Expertise feinabstimmen und so die früheren Trainingszyklen des Modells ergänzen.
(Siehe: Großes Sprachmodell [LLM])
GAN
Ein Generative Adversarial Network (GAN) ist eine Art von Framework für maschinelles Lernen, das bedeutende Fortschritte in der generativen KI vorangetrieben hat, insbesondere bei der Erstellung realistischer Daten – einschließlich Tools für Deepfakes. Bei GANs arbeiten zwei neuronale Netze gegeneinander: Das eine (der Generator) erzeugt auf der Grundlage seiner Trainingsdaten eine Ausgabe, und das andere (der Diskriminator) bewertet diese Ausgabe.
Die beiden Modelle sind im Wesentlichen auf einen Wettstreit programmiert. Der Generator versucht, Ergebnisse zu erzeugen, die überzeugend genug sind, um den Diskriminator zu täuschen, während der Diskriminator daran arbeitet, künstlich erzeugte Daten zu erkennen. Dieser gegensätzliche Prozess kann KI-Ergebnisse optimieren, sodass sie realistischer werden, ohne dass zusätzlicher menschlicher Eingriff erforderlich ist. GANs sind am effektivsten für eng gefasste Anwendungen, wie das Erzeugen realistischer Fotos oder Videos, und weniger für allgemeine KI-Zwecke.
Halluzination
Halluzination ist der Begriff der KI-Branche für den Fall, dass Modelle falsche oder erfundene Informationen generieren. Dies stellt eine große Herausforderung für die Qualität und Zuverlässigkeit von KI dar.
Halluzinationen können zu irreführenden generativen KI-Ergebnissen führen, die potenzielle Risiken in der realen Welt bergen – wie beispielsweise schädliche medizinische Ratschläge bei einer Gesundheitsanfrage.
Es wird angenommen, dass dieses Problem der KI-Erfindung auf Lücken in den Trainingsdaten zurückzuführen ist. Die Verbreitung von Halluzinationen treibt einen Trend hin zu spezialisierteren, vertikalen KI-Modellen voran – domänenspezifische Systeme mit engerem Fachwissen –, um Wissenslücken zu schließen und das Risiko von Desinformation zu minimieren.
Inferenz
Inferenz ist der Prozess, bei dem ein trainiertes KI-Modell ausgeführt wird, um Vorhersagen zu treffen oder Schlussfolgerungen aus neuen Daten zu ziehen. Es ist wichtig zu beachten, dass Inferenz nicht ohne vorheriges Training stattfinden kann; ein Modell muss zunächst Muster aus einem Datensatz lernen, bevor es dieses Wissen effektiv extrapolieren kann.
Viele Arten von Hardware können Inferenz durchführen, von Smartphone-Prozessoren über leistungsstarke GPUs bis hin zu speziellen KI-Beschleunigern. Allerdings ist nicht jede Hardware gleichermaßen leistungsfähig. Sehr große Modelle würden auf einem Standard-Laptop im Vergleich zu einem mit High-End-KI-Chips ausgestatteten Cloud-Server unpraktisch lange laufen.
[Siehe: Training]
Große Sprachmodelle (LLM)
Große Sprachmodelle (LLMs) sind die KI-Modelle, die beliebte Assistenten wie ChatGPT, Claude, Googles Gemini, Metas Llama, Microsoft Copilot und Mistrals Le Chat antreiben. Wenn Sie mit einem KI-Assistenten interagieren, kommunizieren Sie mit einem LLM, das Ihre Anfrage direkt oder mit Hilfe verschiedener Tools wie Webbrowsing oder Code-Interpretern verarbeitet.
LLMs sind tiefe neuronale Netze, die aus Milliarden von numerischen Parametern (oder Gewichten) bestehen und die Beziehungen zwischen Wörtern und Phrasen lernen, wodurch eine mehrdimensionale Darstellung der Sprache entsteht – eine Art linguistische Karte.
Diese Modelle werden durch die Analyse von Mustern in Milliarden von Büchern, Artikeln und Transkripten trainiert. Wenn Sie eine Eingabe an ein LLM senden, generiert es das wahrscheinlichste sprachliche Muster, das zu Ihrer Eingabe passt.
(Siehe: Neuronales Netzwerk)
Speicher-Cache
Speicher-Cache bezeichnet einen Prozess, der die Inferenz (die Generierung von Antworten durch die KI) verbessert. Im Wesentlichen ist Caching eine Optimierungstechnik, die darauf abzielt, die Inferenz effizienter zu gestalten. KI stützt sich auf intensive mathematische Berechnungen, die jeweils Rechenleistung verbrauchen. Caching reduziert die Anzahl der Berechnungen, die ein Modell durchführen muss, indem bestimmte Berechnungen zur Wiederverwendung bei zukünftigen Abfragen gespeichert werden. Es gibt verschiedene Arten des Speicher-Cachings, wobei KV-Caching (Key-Value) ein bekanntes Beispiel für Transformer-basierte Modelle ist. KV-Caching erhöht die Effizienz und beschleunigt die Antworten, indem es die Zeit und den Rechenaufwand reduziert, die zur Generierung von Antworten benötigt werden.
(Siehe: Inferenz)
Neuronales Netzwerk
Ein neuronales Netzwerk ist die mehrschichtige algorithmische Struktur, die Deep Learning und, im weiteren Sinne, den Boom der generativen KI nach dem Aufkommen großer Sprachmodelle untermauert.
Obwohl die Idee, sich bei der Entwicklung von Datenverarbeitungsalgorithmen von den miteinander verbundenen Neuronen des menschlichen Gehirns inspirieren zu lassen, bereits in die 1940er Jahre zurückreicht, war es die jüngste Verbreitung von Grafikprozessoren (GPUs) – vorangetrieben durch die Videospielindustrie –, die das Potenzial dieser Theorie erst wirklich erschloss. Diese Chips erwiesen sich als außerordentlich gut geeignet für das Training von Algorithmen mit weitaus mehr Schichten, als zuvor möglich war, wodurch KI-Systeme auf Basis neuronaler Netze in Bereichen wie Spracherkennung, autonome Navigation und Wirkstoffforschung eine überragende Leistung erzielen konnten.
(Siehe: Large Language Model [LLM])
Open Source
Open Source bezieht sich auf Software – oder zunehmend auch auf KI-Modelle –, deren zugrunde liegender Code öffentlich zugänglich ist, sodass jeder ihn nutzen, einsehen oder ändern kann. Im Bereich der KI ist die Llama-Modellfamilie von Meta ein prominentes Beispiel; bei Betriebssystemen ist Linux die klassische historische Entsprechung. Der Open-Source-Ansatz ermöglicht es Forschern, Entwicklern und Unternehmen weltweit, auf der Arbeit anderer aufzubauen, was den Fortschritt beschleunigt und unabhängige Sicherheitsprüfungen ermöglicht, die geschlossene Systeme nicht ohne Weiteres bieten können. Closed Source bedeutet, dass der Code privat ist – man kann das Produkt nutzen, aber nicht sehen, wie es funktioniert, wie bei den GPT-Modellen von OpenAI. Diese Unterscheidung ist zu einer zentralen Debatte innerhalb der KI-Branche geworden.
Parallelisierung
Parallelisierung bedeutet, viele Operationen gleichzeitig statt nacheinander auszuführen – so als würden zehn Mitarbeiter gleichzeitig an verschiedenen Teilen eines Projekts arbeiten, anstatt dass eine Person alles Schritt für Schritt erledigt. In der KI ist Parallelisierung sowohl für das Training als auch für die Inferenz von grundlegender Bedeutung. Moderne GPUs sind speziell darauf ausgelegt, Tausende von Berechnungen parallel durchzuführen – ein Hauptgrund dafür, dass sie zum Hardware-Rückgrat der Branche geworden sind. Da KI-Systeme immer komplexer und Modelle immer größer werden, ist die Fähigkeit, die Arbeit über viele Chips und Maschinen hinweg zu parallelisieren, zu einem entscheidenden Faktor geworden, der bestimmt, wie schnell und kosteneffizient Modelle erstellt und bereitgestellt werden können. Die Erforschung besserer Parallelisierungsstrategien ist mittlerweile ein eigenständiges Forschungsgebiet.
RAMageddon
RAMageddon ist der scherzhafte neue Begriff für einen ernsten Trend, der die Tech-Branche erfasst: eine zunehmende Verknappung von RAM-Chips (Random Access Memory), die fast alle technischen Produkte antreiben, die wir täglich nutzen. Da die KI-Branche explosionsartig gewachsen ist, kaufen große Tech-Unternehmen und KI-Labore – die alle darum konkurrieren, die leistungsstärkste und effizienteste KI zu entwickeln – so große Mengen an RAM für ihre Rechenzentren, dass für andere kaum noch etwas übrig bleibt. Dieser Lieferengpass treibt die Preise für die verbleibenden Bestände in die Höhe.
Die Auswirkungen erstrecken sich auf Branchen wie Gaming (wo Unternehmen die Preise für Spielkonsolen aufgrund der Knappheit an Speicherchips erhöht haben), Unterhaltungselektronik (wo Engpässe den größten Einbruch bei den Smartphone-Lieferungen seit über einem Jahrzehnt verursachen könnten) und den allgemeinen Unternehmens-IT-Bereich (da Unternehmen Schwierigkeiten haben, genügend RAM für ihre eigenen Rechenzentren zu beschaffen). Es wird erwartet, dass die Preisanstiege so lange anhalten, bis die Knappheit endet, doch leider gibt es kaum Anzeichen dafür, dass dies bald geschehen wird.
Verstärkendes Lernen
Verstärkendes Lernen ist eine Trainingsmethode, bei der ein KI-System durch Versuch und Irrtum lernt und für richtige Handlungen Belohnungen erhält – ähnlich wie beim Training eines Haustiers mit Leckerlis, nur dass das „Haustier“ ein neuronales Netzwerk und das „Leckerli“ ein mathematisches Signal ist, das Erfolg anzeigt. Im Gegensatz zum überwachten Lernen, bei dem ein Modell anhand eines festen Datensatzes mit beschrifteten Beispielen trainiert wird, ermöglicht das verstärkende Lernen einem Modell, seine Umgebung zu erkunden, Handlungen auszuführen und sein Verhalten auf der Grundlage von Feedback kontinuierlich anzupassen. Dieser Ansatz hat sich als besonders effektiv erwiesen, um KI darauf zu trainieren, Spiele zu spielen, Roboter zu steuern und in jüngerer Zeit die Schlussfolgerungsfähigkeiten großer Sprachmodelle zu schärfen. Techniken wie das verstärkende Lernen aus menschlichem Feedback (RLHF) spielen mittlerweile eine zentrale Rolle dabei, wie führende KI-Labore ihre Modelle so verfeinern, dass sie hilfreicher, genauer und sicherer werden.
Token
Die Mensch-Maschine-Kommunikation birgt offensichtliche Herausforderungen: Menschen verwenden menschliche Sprache, während KI-Programme Aufgaben durch komplexe, datengestützte algorithmische Prozesse ausführen. Token überbrücken diese Kluft. Sie sind die grundlegenden Bausteine der Mensch-KI-Kommunikation und repräsentieren diskrete Datensegmente, die von einem LLM verarbeitet oder erzeugt werden. Sie entstehen durch Tokenisierung, bei der Rohtext in verarbeitbare Einheiten zerlegt wird, die ein Sprachmodell verstehen kann – ähnlich wie ein Compiler menschliche Sprache in Binärcode für einen Computer übersetzt. Im Unternehmenskontext bestimmen Token auch die Kosten – die meisten KI-Unternehmen berechnen die Nutzung von LLMs auf Token-Basis, was bedeutet: Je mehr ein Unternehmen nutzt, desto mehr zahlt es.
Token-Durchsatz
Noch einmal: Token sind die kleinen Textbausteine – oft Teile von Wörtern –, in die KI-Sprachmodelle Sprache zur Verarbeitung zerlegen; sie sind in etwa mit „Wörtern“ vergleichbar, um KI-Workloads zu verstehen. Durchsatz bezieht sich darauf, wie viel in einer bestimmten Zeit verarbeitet werden kann, sodass der Token-Durchsatz im Wesentlichen misst, wie viel KI-Arbeit ein System gleichzeitig bewältigen kann. Ein hoher Token-Durchsatz ist ein zentrales Ziel für KI-Infrastrukturteams, da er bestimmt, wie viele Nutzer ein Modell gleichzeitig bedienen kann und wie schnell jeder eine Antwort erhält. Der KI-Forscher Andrej Karpathy hat beschrieben, dass er sich unwohl fühlt, wenn seine KI-Abonnements ungenutzt bleiben – was seine Sorge aus der Studienzeit über ungenutzte teure Hardware widerspiegelt –, ein Gefühl, das verdeutlicht, warum die Maximierung des Token-Durchsatzes in der Branche zu einer Obsession geworden ist.
Training
Die Entwicklung von KI im Bereich des maschinellen Lernens umfasst einen Prozess, der als Training bezeichnet wird. Einfach ausgedrückt bedeutet dies, dass Daten in ein Modell eingespeist werden, damit es Muster lernen und nützliche Ergebnisse generieren kann. Es ist der Prozess, durch den das System auf Merkmale in den Daten reagiert und seine Ergebnisse an ein gewünschtes Ziel anpasst – sei es das Erkennen von Katzenbildern oder das Verfassen eines Haikus auf Abruf.
Das Training kann kostspielig sein, da es riesige Datenmengen erfordert, und der Bedarf an Daten steigt weiter an. Aus diesem Grund können hybride Ansätze, wie die Feinabstimmung einer regelbasierten KI mit gezielten Daten, dabei helfen, die Kosten zu kontrollieren, ohne bei Null anfangen zu müssen.
[Siehe: Inferenz]
Transferlernen
Eine Technik, bei der ein vortrainiertes KI-Modell als Ausgangspunkt für die Entwicklung eines neuen Modells für eine andere, aber in der Regel verwandte Aufgabe dient. Dadurch können die aus früheren Trainingszyklen gewonnenen Erkenntnisse wiederverwendet werden.
Transferlernen kann die Effizienz steigern, indem es die Modellentwicklung verkürzt. Es ist auch nützlich, wenn die Daten für die neue Aufgabe begrenzt sind. Der Ansatz hat jedoch Einschränkungen. Modelle, die sich für allgemeine Fähigkeiten auf Transferlernen stützen, erfordern wahrscheinlich zusätzliches Training mit domänenspezifischen Daten, um in ihrem Schwerpunktbereich gute Leistungen zu erbringen.
(Siehe: Feinabstimmung)
Gewichte
Gewichte spielen eine zentrale Rolle beim KI-Training, da sie die Bedeutung (oder das „Gewicht“) bestimmen, die verschiedenen Merkmalen (oder Eingabevariablen) in den Trainingsdaten zugewiesen wird, und so die Ausgabe des Modells beeinflussen.
Mit anderen Worten: Gewichte sind numerische Parameter, die definieren, was in einem Datensatz für eine bestimmte Trainingsaufgabe am wichtigsten ist. Sie wirken durch die Multiplikation der Eingaben. Das Modelltraining beginnt in der Regel mit zufällig zugewiesenen Gewichten, die sich im Laufe der Iterationen des Modells anpassen, um Ausgaben zu erzeugen, die dem Ziel besser entsprechen.
Beispielsweise könnte ein KI-Modell, das anhand historischer Immobiliendaten trainiert wurde, um Immobilienpreise vorherzusagen, Gewichte für Merkmale wie die Anzahl der Schlaf- und Badezimmer, die Art der Immobilie (Einfamilien- oder Doppelhaushälfte), die Verfügbarkeit von Parkplätzen, eine Garage usw. haben. Die Gewichte, die das Modell jeder Eingabe zuweist, spiegeln deren Einfluss auf den Immobilienwert auf der Grundlage des Datensatzes wider.
Validierungsverlust
Der Validierungsverlust ist eine Metrik, die angibt, wie gut ein KI-Modell während des Trainings lernt – niedrigere Werte sind besser. Forscher überwachen ihn genau als eine Art Echtzeit-Zeugnis und nutzen ihn, um zu entscheiden, wann das Training beendet, Hyperparameter angepasst oder potenzielle Probleme untersucht werden sollten. Ein wichtiges Problem, das er aufzeigt, ist das Überanpassen (Overfitting) – ein Zustand, bei dem ein Modell seine Trainingsdaten auswendig lernt, anstatt verallgemeinerbare Muster zu erlernen. Stellen Sie sich das als den Unterschied zwischen einem Schüler vor, der den Stoff wirklich versteht, und einem, der lediglich die Prüfung vom letzten Jahr auswendig gelernt hat – der Validierungsverlust hilft dabei, aufzudecken, welchen Weg Ihr Modell einschlägt.
Dieser Artikel wird regelmäßig mit neuen Informationen aktualisiert.
Das Softwareunternehmen Intrinsic Robotics fusioniert unter dem Dach von Alphabet mit Google
Google baut seine Präsenz im Bereich der physischen KI durch die Integration einer bekannten Robotik-Softwareplattform aus.Intrinsic, ein Unternehmen von Alphabet, das KI-Modelle und Software entwicke
Apples Zukunft im Hardware-Bereich: Ternus übernimmt das Ruder
Da Apple bestrebt ist, seinen Wettbewerbsvorteil im Bereich der künstlichen Intelligenz zu wahren und gleichzeitig mit Zöllen und Instabilitäten in der Lieferkette zu kämpfen hat, steht dem Unternehme
Die FIFA startet mit KI einen Neustart des weltweiten Fußballs – beginnend bei der Weltmeisterschaft
Als Romy Gai, Chief Business Officer der FIFA, die operativen Herausforderungen bei der Ausrichtung einer Weltmeisterschaft mit 48 Mannschaften in Kanada, Mexiko und den Vereinigten Staaten skizzierte





Heim






