Option
Heim
Nachricht
Alibabas ZeroSearch KI senkt Trainingskosten um 88% durch autonomes Lernen

Alibabas ZeroSearch KI senkt Trainingskosten um 88% durch autonomes Lernen

19. September 2025
2

Alibabas "ZeroSearch" KI senkt Trainingskosten um 88% durch autonomes Lernen

Alibabas ZeroSearch: Ein Wendepunkt für die Effizienz des KI-Trainings

Forscher der Alibaba Group haben eine bahnbrechende Methode entwickelt, die möglicherweise die Art und Weise revolutioniert, wie KI-Systeme das Auffinden von Informationen lernen, indem sie kostspielige kommerzielle Suchmaschinen-APIs vollständig umgehen. Ihre ZeroSearch-Technologie ermöglicht es großen Sprachmodellen, ausgefeilte Suchfähigkeiten durch simulierte Umgebungen zu kultivieren, anstatt während der Trainingsphasen mit herkömmlichen Suchmaschinen zu interagieren.

"Traditionelles Reinforcement Learning erfordert umfangreiche Suchanfragen, die erhebliche API-Kosten anhäufen und die Skalierbarkeit behindern", erklären die Forscher in ihrem kürzlich veröffentlichten arXiv-Paper. "ZeroSearch stellt ein kosteneffizientes Reinforcement-Learning-Framework dar, das die LLM-Suchfähigkeiten unabhängig von tatsächlichen Suchmaschinen verbessert."

Die Mechanik hinter suchfreiem Training

Aktuelle KI-Trainingsmethoden sind mit zwei Hauptproblemen konfrontiert: uneinheitliche Dokumentenqualität von kommerziellen Suchmaschinen während der Trainingszyklen und unerschwingliche Kosten durch massive API-Aufrufe bei Diensten wie Google Search.

ZeroSearch implementiert einen innovativen Zwei-Phasen-Ansatz:

  1. Anfängliches überwachtes Feintuning verwandelt ein LLM in ein Modul zur Dokumentenerstellung
  2. Fortgeschrittene lehrplanbasierte Verstärkung variiert schrittweise die Ausgabequalität

"Unsere grundlegende Entdeckung zeigt, dass vortrainierte LLMs von Natur aus über ausreichend Weltwissen verfügen, um kontextuell passende Dokumente zu generieren", so die Forscher. "Der Hauptunterschied zwischen simulierten und realen Suchergebnissen besteht eher in stilistischen Textunterschieden als in inhaltlichen Lücken."

Leistungsvergleiche zeigen signifikante Vorteile

Rigorose Tests mit sieben verschiedenen Frage-Antwort-Datensätzen zeigten den Wettbewerbsvorteil von ZeroSearch:

  • 7B-Parameter-Modelle entsprachen der Genauigkeit der Google-Suche
  • 14B-Parameter-Konfigurationen übertrafen die kommerzielle Suchleistung

Die finanziellen Auswirkungen sind besonders auffällig:

  • Traditionelles Training mit 64K Abfragen: $586,70 über SerpAPI
  • ZeroSearch-Äquivalent: 70,80 $ mit vier A100-GPUs
  • Gesamtkostenreduzierung: 88%

"Diese Ergebnisse bestätigen LLMs als brauchbaren Ersatz für konventionelle Suchmaschinen in Reinforcement-Learning-Implementierungen", schließt das Forschungsteam.

Breitere Auswirkungen für die KI-Entwicklung

ZeroSearch stellt einen Paradigmenwechsel bei den Trainingsmethoden für künstliche Intelligenz dar, indem es die autonome Entwicklung von Fähigkeiten ohne externe Tool-Abhängigkeiten demonstriert.

Die Technologie verspricht mehrere transformative Auswirkungen:

  • Demokratisierung der Kosten: Verringerung der finanziellen Hürden für Start-ups durch Beseitigung teurer API-Abhängigkeiten
  • Kontrolle der Ausbildung: Ermöglicht eine präzise Regulierung der Informationseingaben während der Modellentwicklung
  • Architektonische Flexibilität: Kompatibel mit allen wichtigen Modellfamilien, einschließlich Qwen-2.5 und LLaMA-3.2

Alibaba hat die komplette Implementierung - einschließlich der Codebasis, der Trainingsdatensätze und der trainierten Modelle - über GitHub und Hugging Face Repositories veröffentlicht.

Diese Innovation ist ein Vorbote einer sich entwickelnden KI-Entwicklungslandschaft, in der fortschrittliche Fähigkeiten durch ausgeklügelte Simulationen und nicht durch die Abhängigkeit von externen Diensten entstehen. Wenn diese autarken Trainingstechniken ausgereift sind, können sie die derzeitigen Abhängigkeiten des technologischen Ökosystems von den großen Plattform-APIs erheblich verändern.

Verwandter Artikel
Verbessert die KI-Personalisierung die Realität oder verzerrt sie sie? Die versteckten Risiken erforscht Verbessert die KI-Personalisierung die Realität oder verzerrt sie sie? Die versteckten Risiken erforscht Die menschliche Zivilisation hat schon früher kognitive Umwälzungen erlebt - die Handschrift hat das Gedächtnis externalisiert, die Taschenrechner haben das Rechnen automatisiert, GPS-Systeme haben di
TreeQuest von Sakana AI steigert die KI-Leistung durch Multi-Modell-Zusammenarbeit TreeQuest von Sakana AI steigert die KI-Leistung durch Multi-Modell-Zusammenarbeit Das japanische KI-Labor Sakana AI hat eine Technik vorgestellt, die es mehreren großen Sprachmodellen (LLMs) ermöglicht, zusammenzuarbeiten und ein hocheffizientes KI-Team zu bilden. Diese Methode mit
ByteDance enthüllt Seed-Thinking-v1.5 KI-Modell zur Verbesserung der Denkfähigkeiten ByteDance enthüllt Seed-Thinking-v1.5 KI-Modell zur Verbesserung der Denkfähigkeiten Das Rennen um fortschrittliche denkende KI begann mit OpenAIs o1-Modell im September 2024 und gewann mit dem Start von DeepSeeks R1 im Januar 2025 an Dynamik.Wichtige KI-Entwickler konkurrieren nun da
Kommentare (0)
0/200
Zurück nach oben
OR