Weniger ist mehr: Wie das Abrufen weniger Dokumente die KI -Antworten verbessert
Retrieval-Augmented Generation (RAG) ist ein innovativer Ansatz zum Aufbau von KI-Systemen, der ein Sprachmodell mit einer externen Wissensquelle kombiniert, um die Genauigkeit zu erhöhen und faktenbasierte Fehler zu reduzieren. Im Wesentlichen sucht die KI nach relevanten Dokumenten, die mit der Anfrage eines Nutzers in Verbindung stehen, und verwendet diese Informationen, um eine präzisere Antwort zu generieren. Diese Methode hat Anerkennung für ihre Fähigkeit gefunden, große Sprachmodelle (LLMs) an realen Daten zu orientieren und das Risiko von Halluzinationen zu minimieren.
Man könnte annehmen, dass die Bereitstellung von mehr Dokumenten einer KI zu besser informierten Antworten führen würde. Eine aktuelle Studie der Hebräischen Universität Jerusalem legt jedoch nahe, dass weniger tatsächlich mehr sein kann, wenn es darum geht, Informationen an eine KI zu liefern.
Weniger Dokumente, bessere Antworten
Die Studie untersuchte, wie die Anzahl der einem RAG-System bereitgestellten Dokumente dessen Leistung beeinflusst. Die Forscher hielten die gesamte Textlänge konstant, variierten die Anzahl der Dokumente von 20 auf 2-4 relevante und erweiterten diese, um das ursprüngliche Textvolumen zu erreichen. Dies ermöglichte es ihnen, den Einfluss der Dokumentenmenge auf die Leistung zu isolieren.
Mit dem MuSiQue-Datensatz, der Trivia-Fragen mit Wikipedia-Absätzen kombiniert, stellten sie fest, dass KI-Modelle oft besser mit weniger Dokumenten abschnitten. Die Genauigkeit verbesserte sich um bis zu 10 % (gemessen am F1-Score), wenn das System sich auf nur wenige Schlüsseldokumente konzentrierte, anstatt auf eine breite Sammlung. Dieser Trend zeigte sich bei verschiedenen Open-Source-Sprachmodellen, wie Metas Llama, mit der bemerkenswerten Ausnahme von Qwen-2, das seine Leistung auch bei mehreren Dokumenten beibehielt.
Quelle: Levy et al.
Dieses überraschende Ergebnis stellt die gängige Annahme infrage, dass mehr Informationen immer helfen. Selbst bei gleicher Textmenge schien die Vielzahl an Dokumenten die Aufgabe der KI zu erschweren, indem sie mehr Rauschen als Signal einführte.
Warum weniger in RAG mehr sein kann
Das Prinzip „weniger ist mehr“ ergibt Sinn, wenn man bedenkt, wie KI-Modelle Informationen verarbeiten. Mit weniger, aber relevanteren Dokumenten kann sich die KI auf den wesentlichen Kontext konzentrieren, ohne abgelenkt zu werden, ähnlich wie ein Schüler, der das relevanteste Material studiert.
In der Studie schnitten Modelle besser ab, wenn ihnen nur die direkt relevanten Dokumente gegeben wurden, da dieser klarere, fokussierte Kontext das Extrahieren der korrekten Informationen erleichterte. Umgekehrt hatte die KI bei vielen Dokumenten oft Schwierigkeiten mit der Mischung aus relevantem und irrelevantem Inhalt. Ähnliche, aber nicht verwandte Dokumente konnten das Modell in die Irre führen und das Risiko von Halluzinationen erhöhen.
Interessanterweise stellte die Studie fest, dass die KI offensichtlich irrelevante Dokumente leichter ignorieren konnte als solche, die nur geringfügig vom Thema abwichen. Dies deutet darauf hin, dass realistische Ablenkungen verwirrender sind als zufällige. Durch die Begrenzung auf nur die notwendigen Dokumente wird die Wahrscheinlichkeit solcher Fallen reduziert.
Zusätzlich senkt die Verwendung weniger Dokumente den Rechenaufwand, was das System effizienter und kostengünstiger macht. Dieser Ansatz verbessert nicht nur die Genauigkeit, sondern steigert auch die Gesamtleistung des RAG-Systems.
Quelle: Levy et al.
RAG neu denken: Zukünftige Richtungen
Diese Erkenntnisse haben bedeutende Auswirkungen auf die Gestaltung zukünftiger KI-Systeme, die auf externem Wissen basieren. Sie deuten darauf hin, dass die Fokussierung auf die Qualität und Relevanz der abgerufenen Dokumente, anstatt auf deren Menge, die Leistung verbessern könnte. Die Autoren der Studie plädieren für Abrufmethoden, die Relevanz und Vielfalt ausbalancieren, um eine umfassende Abdeckung zu gewährleisten, ohne das Modell mit überflüssigem Text zu überfordern.
Zukünftige Forschung könnte bessere Abrufsysteme oder Re-Ranker untersuchen, um wirklich wertvolle Dokumente zu identifizieren und die Verarbeitung mehrerer Quellen durch Sprachmodelle zu verbessern. Die Verbesserung der Modelle selbst, wie bei Qwen-2 zu sehen, könnte auch Einblicke liefern, wie sie robuster gegenüber vielfältigen Eingaben gemacht werden können.
Da KI-Systeme größere Kontextfenster entwickeln, wird die Fähigkeit, mehr Text auf einmal zu verarbeiten, weniger wichtig als die Sicherstellung, dass der Text relevant und kuratiert ist. Die Studie mit dem Titel „Mehr Dokumente, gleiche Länge“ unterstreicht die Bedeutung, sich auf die relevantesten Informationen zu konzentrieren, um die Genauigkeit und Effizienz der KI zu verbessern.
Zusammenfassend stellt diese Forschung unsere Annahmen über die Dateneingabe in KI-Systeme infrage. Durch sorgfältige Auswahl weniger, besserer Dokumente können wir intelligentere, schlankere RAG-Systeme schaffen, die genauere und vertrauenswürdigere Antworten liefern.
Verwandter Artikel
China Telecom investiert in Mianbi Intelligence und erhöht das Kapital für LLM und Dateninfrastruktur auf 713.000 Yuan
Das „Nationalteam“ und die führende Persönlichkeit der Tsinghua-Universität im Bereich der großen Modelle vertiefen ihre strategische Zusammenarbeit. Am 1. März 2026 unterzog sich die Beijing Mianbi I
Die Taotian Group treibt ihre KI-orientierte Umstrukturierung voran und gewährt Praktikanten kostenlose Token-Kontingente
Die TaoTian Group hat kürzlich den „AI Productivity Plan“ eingeführt, der darauf abzielt, die Integration von KI-Technologie in E-Commerce-Abläufe und F&E-Workflows durch die Zuweisung von Ressourcen
Glean nimmt die KI-Infrastruktur von Unternehmen ins Visier
Der Wettlauf um die Vorherrschaft im Bereich der Unternehmens-KI gewinnt an Fahrt. Microsoft integriert Copilot in Office, Google bindet Gemini in Workspace ein, und sowohl OpenAI als auch Anthropic v
Empfehlungen zu verwandten Spezialthemen
Kommentare (51)
이런 연구 결과는 RAG 시스템을 최적화하는 데 정말 중요한 인사이트를 주는 것 같아요. 가끔 검색된 문서가 너무 많으면 AI가 오히려 핵심 내용을 놓치고 산만해지는 걸 본 적 있는데, '적게 가져올수록 더 좋다'는 아이디어가 실제 적용에서 얼마나 효과적일지 궁금해지네요. 프로젝트에 한 번 적용해 봐야겠어요! 👍
Interesante enfoque. A veces menos es más, y en la IA parece no ser diferente. Me pregunto si esa reducción de documentos también podría acelerar las respuestas o si hay algún riesgo de perder contexto clave. 🤔
이거 꽤 흥미롭네요. 문서를 적게 검색할수록 AI 답변이 더 좋아진다고? 🤔 우리 팀 RAG 시스템에 적용해볼까... 그런데 이러면 검색 정밀도가 더 중요해지겠는데, 실제로 구현하기 꽤 까다롭지 않을까?
La RAG est révolutionnaire, mais je me demande si limiter les documents récupérés pourrait parfois manquer des infos cruciales 🤔. Perso, j'opterais pour un juste milieu entre précision et exhaustivité !
Retrieval-Augmented Generation (RAG) ist ein innovativer Ansatz zum Aufbau von KI-Systemen, der ein Sprachmodell mit einer externen Wissensquelle kombiniert, um die Genauigkeit zu erhöhen und faktenbasierte Fehler zu reduzieren. Im Wesentlichen sucht die KI nach relevanten Dokumenten, die mit der Anfrage eines Nutzers in Verbindung stehen, und verwendet diese Informationen, um eine präzisere Antwort zu generieren. Diese Methode hat Anerkennung für ihre Fähigkeit gefunden, große Sprachmodelle (LLMs) an realen Daten zu orientieren und das Risiko von Halluzinationen zu minimieren.
Man könnte annehmen, dass die Bereitstellung von mehr Dokumenten einer KI zu besser informierten Antworten führen würde. Eine aktuelle Studie der Hebräischen Universität Jerusalem legt jedoch nahe, dass weniger tatsächlich mehr sein kann, wenn es darum geht, Informationen an eine KI zu liefern.
Weniger Dokumente, bessere Antworten
Die Studie untersuchte, wie die Anzahl der einem RAG-System bereitgestellten Dokumente dessen Leistung beeinflusst. Die Forscher hielten die gesamte Textlänge konstant, variierten die Anzahl der Dokumente von 20 auf 2-4 relevante und erweiterten diese, um das ursprüngliche Textvolumen zu erreichen. Dies ermöglichte es ihnen, den Einfluss der Dokumentenmenge auf die Leistung zu isolieren.
Mit dem MuSiQue-Datensatz, der Trivia-Fragen mit Wikipedia-Absätzen kombiniert, stellten sie fest, dass KI-Modelle oft besser mit weniger Dokumenten abschnitten. Die Genauigkeit verbesserte sich um bis zu 10 % (gemessen am F1-Score), wenn das System sich auf nur wenige Schlüsseldokumente konzentrierte, anstatt auf eine breite Sammlung. Dieser Trend zeigte sich bei verschiedenen Open-Source-Sprachmodellen, wie Metas Llama, mit der bemerkenswerten Ausnahme von Qwen-2, das seine Leistung auch bei mehreren Dokumenten beibehielt.
Quelle: Levy et al.
Dieses überraschende Ergebnis stellt die gängige Annahme infrage, dass mehr Informationen immer helfen. Selbst bei gleicher Textmenge schien die Vielzahl an Dokumenten die Aufgabe der KI zu erschweren, indem sie mehr Rauschen als Signal einführte.
Warum weniger in RAG mehr sein kann
Das Prinzip „weniger ist mehr“ ergibt Sinn, wenn man bedenkt, wie KI-Modelle Informationen verarbeiten. Mit weniger, aber relevanteren Dokumenten kann sich die KI auf den wesentlichen Kontext konzentrieren, ohne abgelenkt zu werden, ähnlich wie ein Schüler, der das relevanteste Material studiert.
In der Studie schnitten Modelle besser ab, wenn ihnen nur die direkt relevanten Dokumente gegeben wurden, da dieser klarere, fokussierte Kontext das Extrahieren der korrekten Informationen erleichterte. Umgekehrt hatte die KI bei vielen Dokumenten oft Schwierigkeiten mit der Mischung aus relevantem und irrelevantem Inhalt. Ähnliche, aber nicht verwandte Dokumente konnten das Modell in die Irre führen und das Risiko von Halluzinationen erhöhen.
Interessanterweise stellte die Studie fest, dass die KI offensichtlich irrelevante Dokumente leichter ignorieren konnte als solche, die nur geringfügig vom Thema abwichen. Dies deutet darauf hin, dass realistische Ablenkungen verwirrender sind als zufällige. Durch die Begrenzung auf nur die notwendigen Dokumente wird die Wahrscheinlichkeit solcher Fallen reduziert.
Zusätzlich senkt die Verwendung weniger Dokumente den Rechenaufwand, was das System effizienter und kostengünstiger macht. Dieser Ansatz verbessert nicht nur die Genauigkeit, sondern steigert auch die Gesamtleistung des RAG-Systems.
Quelle: Levy et al.
RAG neu denken: Zukünftige Richtungen
Diese Erkenntnisse haben bedeutende Auswirkungen auf die Gestaltung zukünftiger KI-Systeme, die auf externem Wissen basieren. Sie deuten darauf hin, dass die Fokussierung auf die Qualität und Relevanz der abgerufenen Dokumente, anstatt auf deren Menge, die Leistung verbessern könnte. Die Autoren der Studie plädieren für Abrufmethoden, die Relevanz und Vielfalt ausbalancieren, um eine umfassende Abdeckung zu gewährleisten, ohne das Modell mit überflüssigem Text zu überfordern.
Zukünftige Forschung könnte bessere Abrufsysteme oder Re-Ranker untersuchen, um wirklich wertvolle Dokumente zu identifizieren und die Verarbeitung mehrerer Quellen durch Sprachmodelle zu verbessern. Die Verbesserung der Modelle selbst, wie bei Qwen-2 zu sehen, könnte auch Einblicke liefern, wie sie robuster gegenüber vielfältigen Eingaben gemacht werden können.
Da KI-Systeme größere Kontextfenster entwickeln, wird die Fähigkeit, mehr Text auf einmal zu verarbeiten, weniger wichtig als die Sicherstellung, dass der Text relevant und kuratiert ist. Die Studie mit dem Titel „Mehr Dokumente, gleiche Länge“ unterstreicht die Bedeutung, sich auf die relevantesten Informationen zu konzentrieren, um die Genauigkeit und Effizienz der KI zu verbessern.
Zusammenfassend stellt diese Forschung unsere Annahmen über die Dateneingabe in KI-Systeme infrage. Durch sorgfältige Auswahl weniger, besserer Dokumente können wir intelligentere, schlankere RAG-Systeme schaffen, die genauere und vertrauenswürdigere Antworten liefern.
China Telecom investiert in Mianbi Intelligence und erhöht das Kapital für LLM und Dateninfrastruktur auf 713.000 Yuan
Das „Nationalteam“ und die führende Persönlichkeit der Tsinghua-Universität im Bereich der großen Modelle vertiefen ihre strategische Zusammenarbeit. Am 1. März 2026 unterzog sich die Beijing Mianbi I
Die Taotian Group treibt ihre KI-orientierte Umstrukturierung voran und gewährt Praktikanten kostenlose Token-Kontingente
Die TaoTian Group hat kürzlich den „AI Productivity Plan“ eingeführt, der darauf abzielt, die Integration von KI-Technologie in E-Commerce-Abläufe und F&E-Workflows durch die Zuweisung von Ressourcen
Glean nimmt die KI-Infrastruktur von Unternehmen ins Visier
Der Wettlauf um die Vorherrschaft im Bereich der Unternehmens-KI gewinnt an Fahrt. Microsoft integriert Copilot in Office, Google bindet Gemini in Workspace ein, und sowohl OpenAI als auch Anthropic v
이런 연구 결과는 RAG 시스템을 최적화하는 데 정말 중요한 인사이트를 주는 것 같아요. 가끔 검색된 문서가 너무 많으면 AI가 오히려 핵심 내용을 놓치고 산만해지는 걸 본 적 있는데, '적게 가져올수록 더 좋다'는 아이디어가 실제 적용에서 얼마나 효과적일지 궁금해지네요. 프로젝트에 한 번 적용해 봐야겠어요! 👍
Interesante enfoque. A veces menos es más, y en la IA parece no ser diferente. Me pregunto si esa reducción de documentos también podría acelerar las respuestas o si hay algún riesgo de perder contexto clave. 🤔
이거 꽤 흥미롭네요. 문서를 적게 검색할수록 AI 답변이 더 좋아진다고? 🤔 우리 팀 RAG 시스템에 적용해볼까... 그런데 이러면 검색 정밀도가 더 중요해지겠는데, 실제로 구현하기 꽤 까다롭지 않을까?
La RAG est révolutionnaire, mais je me demande si limiter les documents récupérés pourrait parfois manquer des infos cruciales 🤔. Perso, j'opterais pour un juste milieu entre précision et exhaustivité !





Heim






