Heim
MiniMax M2.5 wird Open Source und läutet damit das Zeitalter erschwinglicher KI-Agenten ein
MiniMax hat das Modell M2.5 auf den Markt gebracht, die dritte Version seiner M2-Serie, die innerhalb von nur 108 Tagen veröffentlicht wurde. Die Open-Source-Modellgewichte sind nun auf ModelScope verfügbar und stellen einen bedeutenden Fortschritt in Bezug auf Leistung, Effizienz und Erschwinglichkeit dar. Es zeichnet sich durch hervorragende Programmier-, Such- und Arbeitsplatzanwendungen aus. Darüber hinaus bietet es einen nahtlosen Zugriffspfad – von der No-Code-Nutzung bis zum privaten Einsatz – sowie eine umfassende Anleitung für den Aufruf von Tools und die Optimierung von Inferenzparametern und läutet damit eine Ära kostengünstiger KI-Agenten ein.

Kernfunktionen sorgen für multidimensionale Durchbrüche
M2.5 hat in mehreren maßgeblichen Benchmarks hervorragende Ergebnisse erzielt. Es erreichte 80,2 % bei SWE-Bench Verified, übertraf damit GPT-5.2 und näherte sich Claude Opus4.5. Bei Multi-SWE-Bench erzielte es 51,3 % und belegte damit den ersten Platz in der mehrsprachigen Programmierleistung. Die BrowseComp-Leistung erreichte 76,3 % und spiegelte damit starke Vorteile bei Such- und Tool-Aufruf-Aufgaben wider. In der Programmierung demonstriert das Modell Planung auf Architekturebene, deckt den gesamten Softwareentwicklungslebenszyklus ab und ermöglicht eine plattformübergreifende Full-Stack-Entwicklung mit einer besseren Framework-Generalisierung als Claude Opus4.6. Bei der Suche reduziert es die Anzahl der Interaktionsrunden um 20 % und zeichnet sich bei Suchaufgaben auf Expertenniveau aus. Für Büroanwendungen integriert es Fachwissen aus den Bereichen Finanzen und Recht, bietet fortschrittliche Produktivitätsfunktionen und erreicht in internen Bewertungen eine Erfolgsquote von 59,0 % gegenüber gängigen Modellen. Gleichzeitig ist M2.5 um 37 % schneller als M2.1, entspricht Claude Opus4.6 in der Reaktionszeit und kostet nur ein Zehntel so viel.
Schnelle Iteration durch technologische Innovation
Die rasante Entwicklung von M2.5 wird durch drei zentrale technologische Fortschritte vorangetrieben: erstens das native Agent-RL-Framework von Forge, das eine etwa 40-fache Beschleunigung des Trainings ermöglicht; zweitens der CISPO-Algorithmus, der Stabilität bei groß angelegten Trainings gewährleistet und das Problem der Kreditvergabe bei langen Kontexten löst; und drittens ein innovatives Belohnungsdesign, das die Modellleistung und die Reaktionsgeschwindigkeit in Einklang bringt. Dank dieser Technologien bewältigt M2.5 nun 30 % der täglichen Aufgaben und 80 % der neuen Code-Einreichungen innerhalb von MiniMax. Innerhalb von 108 Tagen stieg die SWE-Bench-verifizierte Punktzahl der M2-Serie von 69,4 % auf 80,2 %, mit einer Iterationsgeschwindigkeit, die den Mainstream-Modellen der Branche voraus ist.
Mehrere Bereitstellungsoptionen für verschiedene Szenarien
M2.5 bietet drei Zugriffsmethoden: No-Code, API-Aufrufe und lokale Bereitstellung, um den unterschiedlichen Anforderungen der Benutzer gerecht zu werden. Nicht-technische Benutzer können sofort mit der MiniMax Agent-Weboberfläche loslegen, auf der von der Community über 10.000 wiederverwendbare „Expert”-Agenten erstellt wurden. Entwickler können die kostenlose API auf ModelScope oder die offizielle API nutzen. Es sind zwei offizielle API-Versionen verfügbar – Lightning und Standard – mit Kosten, die zwischen 1/10 und 1/20 vergleichbarer Modelle liegen. Für die lokale Bereitstellung werden vier Lösungen unterstützt: SGLang, vLLM, Transformers und MLX, die jeweils auf hochparallele Produktion, kleine bis mittlere Bereitstellungen, schnelle Validierung oder lokale Entwicklung auf Mac-Basis zugeschnitten sind und mit Hardwareanforderungen und Betriebsanweisungen geliefert werden.
Spezielle Unterstützung für Tool-Aufrufe und Parameteroptimierung
M2.5 unterstützt nativ strukturierte Tool-Aufrufe und ermöglicht so den parallelen Aufruf mehrerer Tools. Bei der Bereitstellung mit vLLM oder SGLang können Sie direkt das OpenAI SDK-Format verwenden; andere Frameworks erfordern eine manuelle Analyse der XML-formatierten Ausgaben. Es werden ein vollständiger Workflow und Best Practices bereitgestellt, um die Tool-Ergebnisse wieder in das Modell zurückzuführen. Für die Inferenz werden die folgenden Parametereinstellungen empfohlen: temperature=1.0, top_p=0.95 und top_k=40, mit Flexibilität zur Optimierung für bestimmte Anwendungsfälle. Programmieraufforderungen können die architektonische Argumentation des Modells nutzen, und das Modell passt sich gut an über 10 Programmiersprachen und verschiedene Scaffolding-Tools an.
Verwandter Artikel
Die experimentelle KI „Claude“ von Anthropic wickelt in einem E-Commerce-Test Verhandlungen und Transaktionen ab
Angesichts der rasanten Fortschritte im Bereich der künstlichen Intelligenz hat Anthropic am vergangenen Freitag still und leise ein internes Experiment namens „Project Deal“ gestartet, um das Potenzi
DeepSeek Code steht kurz vor der Markteinführung
Angesichts der rasanten Entwicklung der KI-Technologie befindet sich DeepSeek an einem spannenden Wendepunkt. Das KI-Unternehmen gab kürzlich bekannt, dass es sich Finanzmittel in Höhe von über 70 Mil
Musks Grok: 1,5 Billionen Parameter und die Übernahme von Cursor-Code – bahnbrechende Neuerung oder nur ein Bluff?
Elon Musk macht endlich einen Schritt.Im Wettlauf um die KI-Programmierung legen OpenAI und Anthropic einen Gang zu, während xAI hinterherzuhinken scheint. Musk hat oft sein Ziel bekräftigt, Claude Ko
Empfehlungen zu verwandten Spezialthemen
Kommentare (2)
Finally, MiniMax decided to open-source M2.5? About time! Though I'm a bit skeptical about the whole "affordable AI agents" hype – reminds me of those "free" trials that end up costing an arm and a leg. Let's see if the weights actually run on my laptop without melting it 🔥🤷
¡Esto es enorme! Que MiniMax abra su modelo M2.5 como código abierto en un tiempo récord realmente puede cambiar el juego 🚀. Hace que los agentes de IA avanzados sean mucho más accesibles para desarrolladores individuales y pequeñas empresas. Solo espero que esto presione a otros grandes actores y acelere el ritmo de la innovación en IA. Sin embargo, siempre me preocupa un poco la seguridad y los sesgos con los modelos open-source tan rápidamente disponibles. ¿Cómo se manejará eso?
MiniMax hat das Modell M2.5 auf den Markt gebracht, die dritte Version seiner M2-Serie, die innerhalb von nur 108 Tagen veröffentlicht wurde. Die Open-Source-Modellgewichte sind nun auf ModelScope verfügbar und stellen einen bedeutenden Fortschritt in Bezug auf Leistung, Effizienz und Erschwinglichkeit dar. Es zeichnet sich durch hervorragende Programmier-, Such- und Arbeitsplatzanwendungen aus. Darüber hinaus bietet es einen nahtlosen Zugriffspfad – von der No-Code-Nutzung bis zum privaten Einsatz – sowie eine umfassende Anleitung für den Aufruf von Tools und die Optimierung von Inferenzparametern und läutet damit eine Ära kostengünstiger KI-Agenten ein.

Kernfunktionen sorgen für multidimensionale Durchbrüche
M2.5 hat in mehreren maßgeblichen Benchmarks hervorragende Ergebnisse erzielt. Es erreichte 80,2 % bei SWE-Bench Verified, übertraf damit GPT-5.2 und näherte sich Claude Opus4.5. Bei Multi-SWE-Bench erzielte es 51,3 % und belegte damit den ersten Platz in der mehrsprachigen Programmierleistung. Die BrowseComp-Leistung erreichte 76,3 % und spiegelte damit starke Vorteile bei Such- und Tool-Aufruf-Aufgaben wider. In der Programmierung demonstriert das Modell Planung auf Architekturebene, deckt den gesamten Softwareentwicklungslebenszyklus ab und ermöglicht eine plattformübergreifende Full-Stack-Entwicklung mit einer besseren Framework-Generalisierung als Claude Opus4.6. Bei der Suche reduziert es die Anzahl der Interaktionsrunden um 20 % und zeichnet sich bei Suchaufgaben auf Expertenniveau aus. Für Büroanwendungen integriert es Fachwissen aus den Bereichen Finanzen und Recht, bietet fortschrittliche Produktivitätsfunktionen und erreicht in internen Bewertungen eine Erfolgsquote von 59,0 % gegenüber gängigen Modellen. Gleichzeitig ist M2.5 um 37 % schneller als M2.1, entspricht Claude Opus4.6 in der Reaktionszeit und kostet nur ein Zehntel so viel.
Schnelle Iteration durch technologische Innovation
Die rasante Entwicklung von M2.5 wird durch drei zentrale technologische Fortschritte vorangetrieben: erstens das native Agent-RL-Framework von Forge, das eine etwa 40-fache Beschleunigung des Trainings ermöglicht; zweitens der CISPO-Algorithmus, der Stabilität bei groß angelegten Trainings gewährleistet und das Problem der Kreditvergabe bei langen Kontexten löst; und drittens ein innovatives Belohnungsdesign, das die Modellleistung und die Reaktionsgeschwindigkeit in Einklang bringt. Dank dieser Technologien bewältigt M2.5 nun 30 % der täglichen Aufgaben und 80 % der neuen Code-Einreichungen innerhalb von MiniMax. Innerhalb von 108 Tagen stieg die SWE-Bench-verifizierte Punktzahl der M2-Serie von 69,4 % auf 80,2 %, mit einer Iterationsgeschwindigkeit, die den Mainstream-Modellen der Branche voraus ist.
Mehrere Bereitstellungsoptionen für verschiedene Szenarien
M2.5 bietet drei Zugriffsmethoden: No-Code, API-Aufrufe und lokale Bereitstellung, um den unterschiedlichen Anforderungen der Benutzer gerecht zu werden. Nicht-technische Benutzer können sofort mit der MiniMax Agent-Weboberfläche loslegen, auf der von der Community über 10.000 wiederverwendbare „Expert”-Agenten erstellt wurden. Entwickler können die kostenlose API auf ModelScope oder die offizielle API nutzen. Es sind zwei offizielle API-Versionen verfügbar – Lightning und Standard – mit Kosten, die zwischen 1/10 und 1/20 vergleichbarer Modelle liegen. Für die lokale Bereitstellung werden vier Lösungen unterstützt: SGLang, vLLM, Transformers und MLX, die jeweils auf hochparallele Produktion, kleine bis mittlere Bereitstellungen, schnelle Validierung oder lokale Entwicklung auf Mac-Basis zugeschnitten sind und mit Hardwareanforderungen und Betriebsanweisungen geliefert werden.
Spezielle Unterstützung für Tool-Aufrufe und Parameteroptimierung
M2.5 unterstützt nativ strukturierte Tool-Aufrufe und ermöglicht so den parallelen Aufruf mehrerer Tools. Bei der Bereitstellung mit vLLM oder SGLang können Sie direkt das OpenAI SDK-Format verwenden; andere Frameworks erfordern eine manuelle Analyse der XML-formatierten Ausgaben. Es werden ein vollständiger Workflow und Best Practices bereitgestellt, um die Tool-Ergebnisse wieder in das Modell zurückzuführen. Für die Inferenz werden die folgenden Parametereinstellungen empfohlen: temperature=1.0, top_p=0.95 und top_k=40, mit Flexibilität zur Optimierung für bestimmte Anwendungsfälle. Programmieraufforderungen können die architektonische Argumentation des Modells nutzen, und das Modell passt sich gut an über 10 Programmiersprachen und verschiedene Scaffolding-Tools an.
Die experimentelle KI „Claude“ von Anthropic wickelt in einem E-Commerce-Test Verhandlungen und Transaktionen ab
Angesichts der rasanten Fortschritte im Bereich der künstlichen Intelligenz hat Anthropic am vergangenen Freitag still und leise ein internes Experiment namens „Project Deal“ gestartet, um das Potenzi
DeepSeek Code steht kurz vor der Markteinführung
Angesichts der rasanten Entwicklung der KI-Technologie befindet sich DeepSeek an einem spannenden Wendepunkt. Das KI-Unternehmen gab kürzlich bekannt, dass es sich Finanzmittel in Höhe von über 70 Mil
Musks Grok: 1,5 Billionen Parameter und die Übernahme von Cursor-Code – bahnbrechende Neuerung oder nur ein Bluff?
Elon Musk macht endlich einen Schritt.Im Wettlauf um die KI-Programmierung legen OpenAI und Anthropic einen Gang zu, während xAI hinterherzuhinken scheint. Musk hat oft sein Ziel bekräftigt, Claude Ko
Finally, MiniMax decided to open-source M2.5? About time! Though I'm a bit skeptical about the whole "affordable AI agents" hype – reminds me of those "free" trials that end up costing an arm and a leg. Let's see if the weights actually run on my laptop without melting it 🔥🤷
¡Esto es enorme! Que MiniMax abra su modelo M2.5 como código abierto en un tiempo récord realmente puede cambiar el juego 🚀. Hace que los agentes de IA avanzados sean mucho más accesibles para desarrolladores individuales y pequeñas empresas. Solo espero que esto presione a otros grandes actores y acelere el ritmo de la innovación en IA. Sin embargo, siempre me preocupa un poco la seguridad y los sesgos con los modelos open-source tan rápidamente disponibles. ¿Cómo se manejará eso?











