Heim
Baidu bringt Ernie 5.1 auf den Markt, senkt die Kosten für das Vortraining um 94 % und zählt weltweit zu den vier führenden Anbietern
Baidu hat am 11. Mai 2026 offiziell sein Sprachmodell der nächsten Generation, Ernie 5.1, vorgestellt. Aufbauend auf der im Januar veröffentlichten Vortrainingsgrundlage von Ernie 5.0 – einem Modell mit 2,4 Billionen Parametern – wurde diese neue Version unter Verwendung eines innovativen „One-Shot-Elastic-Training-Frameworks“ entwickelt. Dieser Ansatz ermöglichte es Baidu, mehrere Modellgrößen in einem einzigen Trainingszyklus zu optimieren und die Vortrainingskosten von Ernie 5.1 auf nur 6 % der Kosten vergleichbarer Modelle zu senken.

Am 9. Mai belegte Ernie 5.1 mit einer Punktzahl von 1223 Punkten weltweit den vierten Platz und rangierte unter den chinesischen Modellen an erster Stelle der Arena Search-Rangliste, was seine außergewöhnliche Effizienz und ausgewogene Leistung unterstreicht.
Architektonisch zeichnet sich Ernie 5.1 durch ein Submodell-Design aus, bei dem Tiefe, Breite und Anzahl der aktiven Experten einstellbar sind. Die Gesamtzahl der Parameter beträgt nur ein Drittel derjenigen seines Vorgängers, und die Anzahl der pro Abfrage aktivierten effektiven Parameter wurde etwa halbiert. Um den bei Multi-Skill-Trainings häufig auftretenden „See-Saw-Effekt“ zu beheben, implementierte Baidu einen vierphasigen Post-Training-Prozess. Diese Methode nutzt parallelen spezialisierten Trainingscode, Inferenz und Proxy-Expertenmodelle in Kombination mit Strategiedestillation und verstärktem Lernen und löst so effektiv die branchenweite Herausforderung, Programmierfähigkeiten mit kreativem Denken in Einklang zu bringen. Darüber hinaus entkoppelt eine überarbeitete Infrastruktur für verstärktes Lernen Modellaktualisierungen, die Generierung von Antworten und die Bewertung. In Verbindung mit einer standardisierten Bibliothek für Berechnungen mit geringer Genauigkeit verbessert dies die Stabilität des groß angelegten Trainings erheblich.

Verwandter Artikel
Anthropogenic Einnahmen steigen rasant, Marktkapital nähert sich der Marke von einer Billion Dollar
Berichte deuten darauf hin, dass Anthropic in nur wenigen Monaten einen erheblichen Umsatzzuwachs verzeichnet hat. Der jährlich berechnete Umsatz des Unternehmens übersteigt nun 30 Milliarden US-Dollar – das ist mehr als das Dreifache des Wertes Ende
Apple entfernt die Cal AI-App aufgrund nicht autorisierter In-App-Käufe und manipulativer Abrechnungspraktiken.
Apples jüngste Entfernung von Cal AI, einer beliebten KI-basierten Ernährungsüberwachungsapp innerhalb von MyFitnessPal, unterstreicht die strenge Einhaltung der App Store-Richtlinien bezüglich externer Zahlungen und Abonnements. Die App, die jährlic
Die tokenbasierte Abrechnungsmethode von Github Copilot löst Empörung bei Entwicklern aus
Die goldene Ära von Microsofts GitHub Copilot könnte zu Ende gehen – insbesondere für einzelne Nutzer. Das Unternehmen wechselt von einer festen Abonnementgebühr zu einem tokenbasierten Abrechnungsmodell, was die Kosten erheblich erhöhen könnte. Währ
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Baidu hat am 11. Mai 2026 offiziell sein Sprachmodell der nächsten Generation, Ernie 5.1, vorgestellt. Aufbauend auf der im Januar veröffentlichten Vortrainingsgrundlage von Ernie 5.0 – einem Modell mit 2,4 Billionen Parametern – wurde diese neue Version unter Verwendung eines innovativen „One-Shot-Elastic-Training-Frameworks“ entwickelt. Dieser Ansatz ermöglichte es Baidu, mehrere Modellgrößen in einem einzigen Trainingszyklus zu optimieren und die Vortrainingskosten von Ernie 5.1 auf nur 6 % der Kosten vergleichbarer Modelle zu senken.

Am 9. Mai belegte Ernie 5.1 mit einer Punktzahl von 1223 Punkten weltweit den vierten Platz und rangierte unter den chinesischen Modellen an erster Stelle der Arena Search-Rangliste, was seine außergewöhnliche Effizienz und ausgewogene Leistung unterstreicht.
Architektonisch zeichnet sich Ernie 5.1 durch ein Submodell-Design aus, bei dem Tiefe, Breite und Anzahl der aktiven Experten einstellbar sind. Die Gesamtzahl der Parameter beträgt nur ein Drittel derjenigen seines Vorgängers, und die Anzahl der pro Abfrage aktivierten effektiven Parameter wurde etwa halbiert. Um den bei Multi-Skill-Trainings häufig auftretenden „See-Saw-Effekt“ zu beheben, implementierte Baidu einen vierphasigen Post-Training-Prozess. Diese Methode nutzt parallelen spezialisierten Trainingscode, Inferenz und Proxy-Expertenmodelle in Kombination mit Strategiedestillation und verstärktem Lernen und löst so effektiv die branchenweite Herausforderung, Programmierfähigkeiten mit kreativem Denken in Einklang zu bringen. Darüber hinaus entkoppelt eine überarbeitete Infrastruktur für verstärktes Lernen Modellaktualisierungen, die Generierung von Antworten und die Bewertung. In Verbindung mit einer standardisierten Bibliothek für Berechnungen mit geringer Genauigkeit verbessert dies die Stabilität des groß angelegten Trainings erheblich.

Anthropogenic Einnahmen steigen rasant, Marktkapital nähert sich der Marke von einer Billion Dollar
Berichte deuten darauf hin, dass Anthropic in nur wenigen Monaten einen erheblichen Umsatzzuwachs verzeichnet hat. Der jährlich berechnete Umsatz des Unternehmens übersteigt nun 30 Milliarden US-Dollar – das ist mehr als das Dreifache des Wertes Ende
Apple entfernt die Cal AI-App aufgrund nicht autorisierter In-App-Käufe und manipulativer Abrechnungspraktiken.
Apples jüngste Entfernung von Cal AI, einer beliebten KI-basierten Ernährungsüberwachungsapp innerhalb von MyFitnessPal, unterstreicht die strenge Einhaltung der App Store-Richtlinien bezüglich externer Zahlungen und Abonnements. Die App, die jährlic
Die tokenbasierte Abrechnungsmethode von Github Copilot löst Empörung bei Entwicklern aus
Die goldene Ära von Microsofts GitHub Copilot könnte zu Ende gehen – insbesondere für einzelne Nutzer. Das Unternehmen wechselt von einer festen Abonnementgebühr zu einem tokenbasierten Abrechnungsmodell, was die Kosten erheblich erhöhen könnte. Währ











