Option
Heim
Nachricht
Nvidias neuer Lama-3.1-Nemotron-Ultra übertrifft Deepseek R1 mit einer Hälfte der Größe

Nvidias neuer Lama-3.1-Nemotron-Ultra übertrifft Deepseek R1 mit einer Hälfte der Größe

13. April 2025
164

Nvidias neuer Lama-3.1-Nemotron-Ultra übertrifft Deepseek R1 mit einer Hälfte der Größe

Während Meta mit der Prüfung seiner neuesten Llama-4-Modellfamilie zu kämpfen hat, hat Nvidia leise ein neues, vollständig quelloffenes großes Sprachmodell (LLM) eingeführt, das auf Metas früherem Llama-3.1-405B-Instruct-Modell basiert. Das Modell mit dem Namen Llama-3.1-Nemotron-Ultra-253B-v1 verfügt über 253 Milliarden Parameter und ist darauf ausgelegt, in fortgeschrittenem Denken, Befolgen von Anweisungen und KI-Assistenten-Workflows zu glänzen. Nvidia deutete dieses Modell erstmals während seiner jährlichen GPU Technology Conference (GTC) im März an.

Die Veröffentlichung unterstreicht Nvidias fortlaufendes Engagement, die Leistung durch architektonische Innovationen und sorgfältige Nachbearbeitungsprozesse zu verbessern. Am 7. April 2025 angekündigt, sind der Code, die Gewichte und die Nachbearbeitungsdaten des Modells nun frei auf Hugging Face zugänglich. Es ist darauf ausgelegt, nahtlos zwischen komplexen Denkaufgaben und einfacheren Ausgaben basierend auf Systemprompts zu wechseln und bietet Entwicklern Flexibilität in ihren Anwendungen.

Für effiziente Inferenz entwickelt

Aufbauend auf Nvidias früheren Bemühungen, LLMs für Inferenz zu optimieren, integriert das Llama-3.1-Nemotron-Ultra-253B einen Neural Architecture Search (NAS)-Prozess, um seine Architektur zu verfeinern. Dies umfasst innovative Funktionen wie übersprungene Aufmerksamkeitsschichten, fusierte Feedforward-Netzwerke (FFNs) und variable FFN-Kompressionsraten. Diese Änderungen reduzieren den Speicherbedarf und die Rechenanforderungen des Modells, sodass es auf einem einzigen 8x H100 GPU-Knoten ohne Qualitätsverlust bei der Ausgabe eingesetzt werden kann.

Nvidia gibt an, dass dieses Modell eine robuste Leistung bietet und gleichzeitig kosteneffektiv für Rechenzentrumsbereitstellungen ist. Es ist kompatibel mit Nvidias B100- und Hopper-Mikroarchitekturen und wurde sowohl im BF16- als auch im FP8-Präzisionsmodus getestet.

Nachbearbeitung für Denken und Ausrichtung

Das Modell durchlief ein umfassendes Nachbearbeitungsprogramm. Dies umfasste überwachte Feinabstimmung in verschiedenen Domänen wie Mathematik, Codegenerierung, Chat und Werkzeugnutzung, gefolgt von Verstärkendem Lernen mit Group Relative Policy Optimization (GRPO), um seine Fähigkeiten im Befolgen von Anweisungen und im Denken zu verbessern.

Weitere Verfeinerung erfolgte durch eine Wissensdestillation über 65 Milliarden Token sowie fortlaufendes Pretraining mit zusätzlichen 88 Milliarden Token. Die Trainingsdatenquellen umfassten FineWeb, Buzz-V1.2 und Dolma, wobei Nachbearbeitungsprompts und -antworten sowohl aus öffentlichen Korpora als auch aus synthetischen Generierungsmethoden stammten. Dieser Ansatz half dem Modell, zwischen seinen Denkmodi zu unterscheiden.

Verbesserte Leistung in zahlreichen Domänen und Benchmarks

Wenn das Denken aktiviert war, zeigte das Modell erhebliche Verbesserungen bei verschiedenen Benchmarks. Zum Beispiel stieg die Leistung beim MATH500-Benchmark von 80,40 % im Standardmodus auf 97,00 % mit aktiviertem Denken. Ähnlich sprangen die AIME25-Werte von 16,67 % auf 72,50 %, und die LiveCodeBench-Ergebnisse verdoppelten sich mehr als, von 29,03 % auf 66,31 %.

Das Modell glänzte auch bei werkzeugbasierten Aufgaben und allgemeinen Frage-Antwort-Benchmarks (GPQA) mit einer Punktzahl von 76,01 % im Denkmodus im Vergleich zu 56,60 % ohne. Diese Benchmarks wurden mit einer maximalen Sequenzlänge von 32.000 Token durchgeführt, und jeder Test wurde bis zu 16 Mal wiederholt, um Genauigkeit zu gewährleisten.

Im Vergleich zum hochmodernen MoE-Modell DeepSeek R1, das 671 Milliarden Parameter hat, hält Nvidias Modell trotz weniger Parameter stand. Es übertrifft DeepSeek R1 in Aufgaben wie GPQA (76,01 vs. 71,5), IFEval-Anweisungsbefolgung (89,45 vs. 83,3) und LiveCodeBench-Codierungsaufgaben (66,31 vs. 65,9). Allerdings hat DeepSeek R1 in bestimmten Mathematikbewertungen, insbesondere AIME25 (79,8 vs. 72,50) und MATH500 (97,3 vs. 97,00), einen leichten Vorteil.

Diese Ergebnisse zeigen, dass Nvidias dichtes Modell in Denken und allgemeiner Anweisungsausrichtung mit MoE-Modellen mithalten oder sie übertreffen kann, obwohl es in mathematikintensiven Kategorien leicht zurückliegt.

Verwendung und Integration

Das Modell lässt sich nahtlos in die Hugging Face Transformers-Bibliothek (Version 4.48.3 empfohlen) integrieren und unterstützt Sequenzen von bis zu 128.000 Token. Entwickler können das Denkverhalten über Systemprompts umschalten und Dekodierungsstrategien je nach Aufgabenbedarf wählen. Für Denkaufgaben schlägt Nvidia eine Temperaturabtastung (0,6) mit einem Top-p-Wert von 0,95 vor, während deterministische Ausgaben eine gierige Dekodierung empfohlen wird.

Llama-3.1-Nemotron-Ultra-253B unterstützt mehrsprachige Anwendungen, einschließlich Englisch, Deutsch, Französisch, Italienisch, Portugiesisch, Hindi, Spanisch und Thai. Es ist gut geeignet für verschiedene LLM-Anwendungsfälle wie Chatbot-Entwicklung, KI-Agenten-Workflows, Retrieval-Augmented Generation (RAG) und Codegenerierung.

Für kommerzielle Nutzung lizenziert

Unter der Nvidia Open Model License und der Llama 3.1 Community License Agreement veröffentlicht, ist das Modell für kommerzielle Anwendungen bereit. Nvidia betont die Bedeutung einer verantwortungsvollen KI-Entwicklung und fordert Teams auf, die Ausrichtung, Sicherheit und Voreingenommenheit des Modells für ihre spezifischen Anwendungsfälle zu bewerten.

Oleksii Kuchaiev, Nvidias Direktor für KI-Modell-Nachbearbeitung, teilte die Begeisterung über diese offene Veröffentlichung auf X und hob das dichte 253B-Design mit umschaltbaren Denkfähigkeiten sowie die Einbeziehung offener Gewichte und Daten hervor.

Verwandter Artikel
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
Meta AI beantwortet nun Nachrichten von Käufern auf dem Facebook Marketplace Meta AI beantwortet nun Nachrichten von Käufern auf dem Facebook Marketplace Facebook Marketplace führt neue Meta-KI-Funktionen ein, darunter automatische Antworten auf Käuferanfragen, wie das Unternehmen am Donnerstag bekannt gab. Die Plattform nutzt KI außerdem, um die Erste
Meta unterzeichnet Vertrag über Millionen von Amazon-KI-CPUs Meta unterzeichnet Vertrag über Millionen von Amazon-KI-CPUs Amazon hat eine bedeutende Partnerschaft mit Meta geschlossen und setzt dabei erneut auf seine eigenen, speziell entwickelten Chips. Meta hat sich bereit erklärt, Millionen von AWS-Graviton-Chips einz
Empfehlungen zu verwandten Spezialthemen
Bildung und Lernen Die besten AI-basierten Werkzeuge für geplantes Wiederholen: Optimieren Sie Ihr Lernplan für Medizinstudenten und Jurastudenten
Die besten AI-basierten Werkzeuge für geplantes Wiederholen: Optimieren Sie Ihr Lernplan für Medizinstudenten und Jurastudenten

Entdecken Sie die besten KI-basierten Wiederholungstools für das Jahr 2026, ausgewählt von XIX.AI. Unsere hochbewerteten, bahnbrechenden Tools helfen Medizinstudenten und Jurastudenten dabei, ihre Lernpläne so zu optimieren, dass das Gelernte optimal im Gedächtnis bleibt. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von tatsächlichen Tests sowie wöchentlich aktualisierten Rankings. Entfalten Sie jetzt Ihren Vorsprung beim Lernen.

10 Tools
xix.ai
Videoerstellung Die besten KI-Plattformen für die Umwandlung von Text in Video zum Verfassen von Drehbüchern und für visuelles Storytelling
Die besten KI-Plattformen für die Umwandlung von Text in Video zum Verfassen von Drehbüchern und für visuelles Storytelling

Die besten KI-Plattformen für die Umwandlung von Text in Video im Jahr 2026: Erstklassige Tools für das Verfassen von Drehbüchern und visuelles Storytelling. Entdecken Sie leistungsstarke, bahnbrechende Lösungen, mit denen Sie Ihren Text in fesselnde Videos verwandeln können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand unserer wöchentlich aktualisierten Ranglisten und Praxistests. Finden Sie die perfekte Plattform, um Ihre Kreativität und Produktivität zu steigern. Entdecken Sie die sorgfältig zusammengestellte Auswahl bei XIX.AI.

10 Tools
xix.ai
Chatbot KI-Multi-Agent-Orchestratoren: Gestaltung komplexer automatisierter Arbeitsabläufe mithilfe natürlicher Sprache
KI-Multi-Agent-Orchestratoren: Gestaltung komplexer automatisierter Arbeitsabläufe mithilfe natürlicher Sprache

2026 Neuestes: Entdecken Sie die besten AI-Multi-Agenten-Orchestratoren, um mithilfe natürlicher Sprache komplexe automatisierte Arbeitsabläufe zu gestalten. Unsere sorgfältig ausgewählte Liste enthält hochbewertete, leistungsstarke Plattformen für reibungslose Aufgabenerstellung und intelligente Prozessverwaltung. Vergleichen Sie kostenlose und kostenpflichtige Optionen unter Berücksichtigung praktischer Erfahrungen. Nutzen Sie die wöchentlich aktualisierten Rankings von XIX.AI, um einen Vorsprung durch künstliche Intelligenz zu erlangen.

10 Tools
xix.ai
Bildbearbeitung Die besten AI-Softwarelösungen zur Geräuschreduzierung: Beseitigen Sie Körnchen und Artefakte in Nachtaufnahmen bei schwachem Licht.
Die besten AI-Softwarelösungen zur Geräuschreduzierung: Beseitigen Sie Körnchen und Artefakte in Nachtaufnahmen bei schwachem Licht.

Entdecken Sie die besten KI-basierten Softwarelösungen zur Rauschreduzierung für Nachtfotografie in schwach beleuchteten Umgebungen im Jahr 2026. Unsere hochrangig bewertete, sorgfältig ausgewählte Liste vergleicht kostenlose und kostenpflichtige Tools und enthält Ergebnisse aus realen Tests sowie wöchentlich aktualisierte Ranglisten. Entfernen Sie mühelos Unreinheiten und Artefakte aus Ihren Bildern – eröffnen Sie mit XIX.AI den Vorteil der KI-Technologie für Ihre Fotografie.

10 Tools
xix.ai
Chatbot Die besten Generatoren für individuelle KI-Freundinnen: Entwirf einzigartige Persönlichkeiten, Hobbys und Hintergrundgeschichten
Die besten Generatoren für individuelle KI-Freundinnen: Entwirf einzigartige Persönlichkeiten, Hobbys und Hintergrundgeschichten

Entdecken Sie auf XIX.AI die besten Generatoren für individuelle KI-Freundinnen des Jahres 2026. Stöbern Sie in unserer sorgfältig zusammengestellten Liste der besten Angebote, um einzigartige Persönlichkeiten, Hobbys und tiefgründige Hintergrundgeschichten zu entwerfen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Holen Sie sich noch heute Ihre perfekte kreative Begleiterin.

10 Tools
xix.ai
Produktivität Entwickler von KI-Architekturen: Erstellen Sie skalierbare Systemarchitekturen mithilfe natürlicher Sprache
Entwickler von KI-Architekturen: Erstellen Sie skalierbare Systemarchitekturen mithilfe natürlicher Sprache

Entdecken Sie auf XIX.AI die besten Tools für den Entwurf von KI-Architekturen im Jahr 2026. Unsere sorgfältig zusammengestellte Liste der Top-Bewertungen umfasst leistungsstarke, bahnbrechende Lösungen für die Erstellung skalierbarer Systemarchitekturen mithilfe natürlicher Sprache. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schöpfen Sie das Potenzial Ihrer KI voll aus und optimieren Sie noch heute Ihre Entwicklungsprozesse.

10 Tools
xix.ai
Kommentare (54)
0/500
JonathanNelson
JonathanNelson 9. Dezember 2025 09:30:42 MEZ

Интересно, как Nvidia удалось упаковать все эти параметры в модель размером вдвое меньше. Выходит, вложения в архитектуру дают больше преимуществ, чем просто увеличение данных? Хотя, конечно, с учётом их вычислительных ресурсов не стоит удивляться. Что особенно ценно, так это тот факт, что модель открыта. На этом фоне заявления Meta порой звучат слишком громко и с многочисленными оговорками 🤔 Это может изменить правила игры для независимых исследователей!

CharlesYoung
CharlesYoung 3. November 2025 05:30:34 MEZ

¿Nvidia saca otro modelo open-source más potente que DeepSeek R1? 🤔 Me pregunto si esto realmente marcará una diferencia práctica para los desarrolladores o es solo otra carrera por los números en los benchmarks. ¡253 mil millones de parámetros parece excesivo!

DouglasMartínez
DouglasMartínez 18. August 2025 17:01:00 MESZ

Nvidia's new model sounds like a beast! Half the size of DeepSeek R1 but still outperforms it? That's wild efficiency. Can't wait to see how devs play with this open-source gem! 🚀

StephenRoberts
StephenRoberts 1. August 2025 04:48:18 MESZ

Nvidia's new model sounds like a beast! Half the size of DeepSeek R1 but still outshines it? That's some serious tech flex. Can't wait to see how devs play with this open-source gem! 😎

AnthonyRoberts
AnthonyRoberts 24. April 2025 10:35:07 MESZ

Nvidia's new Llama-3.1 Nemotron Ultra is a beast! It's amazing how it outperforms DeepSeek R1 with half the size. I've been using it for my projects and the results are incredible. Just wish it was a bit faster, but overall, a solid choice! 🚀

JohnRoberts
JohnRoberts 23. April 2025 02:03:45 MESZ

¡El Llama-3.1 Nemotron Ultra de Nvidia es impresionante! Supera al DeepSeek R1 con la mitad del tamaño, lo cual es alucinante. Lo he estado usando en mis proyectos y es súper eficiente. Lo único es que puede ser un poco complicado de configurar. Aún así, una excelente opción para quien busque un LLM potente. 🚀

OR