Multiverse Computing macht komprimierte KI-Modelle zum Mainstream
Angesichts einer Ausfallquote bei privaten Unternehmen von bis zu 9,2 % – dem höchsten Stand seit Jahren – riet die Risikokapitalgesellschaft Lux Capital kürzlich KI-abhängigen Unternehmen dazu, sich schriftliche Zusagen für ihre Rechenkapazitäten zu sichern. Da sich die finanzielle Instabilität in der KI-Lieferkette ausbreitet, warnte Lux, dass eine mündliche Vereinbarung nicht mehr ausreiche.
Es gibt jedoch eine völlig andere Option: die Abhängigkeit von externer Recheninfrastruktur gänzlich aufzugeben. Kleinere KI-Modelle, die direkt auf dem Gerät des Nutzers laufen – ohne Rechenzentrum, ohne Cloud-Anbieter und ohne Kontrahentenrisiko – werden mittlerweile leistungsfähig genug, um ernsthaft in Betracht gezogen zu werden. Und Multiverse Computing tritt hier in den Vordergrund.
Das spanische Start-up hat sich im Vergleich zu einigen Mitbewerbern bisher relativ zurückhaltend gezeigt, doch das ändert sich, da die Nachfrage nach KI-Effizienz stark steigt. Nach der Komprimierung von Modellen großer KI-Labore wie OpenAI, Meta, DeepSeek und Mistral AI hat das Unternehmen zwei Produkte veröffentlicht: eine App, die die Fähigkeiten seiner komprimierten Modelle demonstriert, und ein API-Portal – ein Zugang für Entwickler, um auf diese Modelle zuzugreifen und darauf aufzubauen –, wodurch sie einer breiteren Öffentlichkeit zugänglich gemacht werden.
Die CompactifAI-App, deren Name sich von der quanteninspirierten Komprimierungstechnologie von Multiverse ableitet, ist ein KI-Chat-Tool ähnlich wie ChatGPT oder Mistrals Le Chat. Man stellt eine Frage, und das Modell antwortet. Der Unterschied besteht darin, dass Multiverse Gilda eingebettet hat, ein Modell, das laut Angaben des Unternehmens so kompakt ist, dass es lokal und offline ausgeführt werden kann.

Für Endnutzer bietet dies einen Vorgeschmack auf Edge-KI, bei der Daten ihre Geräte nie verlassen und keine Internetverbindung erforderlich ist. Es gibt jedoch einen Haken: Ihre Mobilgeräte müssen über ausreichend RAM und Speicherplatz verfügen. Ist dies nicht der Fall – und bei vielen älteren iPhones ist dies nicht gegeben –, greift die App über die API auf cloudbasierte Modelle zurück. Die Weiterleitung zwischen lokaler und Cloud-Verarbeitung wird automatisch von einem System übernommen, das Multiverse „Ash Nazg“ nennt – ein Name, den Tolkien-Fans als Anspielung auf die Inschrift des Einen Rings in „Der Herr der Ringe“ erkennen werden. Wenn die App jedoch auf die Cloud umleitet, verliert sie ihren primären Datenschutzvorteil.
Diese Einschränkungen deuten darauf hin, dass CompactifAI noch nicht für eine breite Akzeptanz bei Verbrauchern bereit ist, obwohl dies vielleicht nie die Absicht war. Laut Sensor Tower verzeichnete die App im vergangenen Monat weniger als 5.000 Downloads.
Der eigentliche Fokus liegt auf Unternehmen. Heute startet Multiverse ein Self-Service-API-Portal, das Entwicklern und Unternehmen direkten Zugriff auf seine komprimierten Modelle bietet – ganz ohne AWS Marketplace.
„Das CompactifAI-API-Portal bietet Entwicklern [jetzt] direkten Zugriff auf komprimierte Modelle mit der Transparenz und Kontrolle, die für den Einsatz in der Produktion erforderlich sind“, sagte CEO Enrique Lizaso in einer Erklärung.
Die Echtzeit-Nutzungsüberwachung ist ein zentrales Merkmal der API, und das ist kein Zufall. Neben den potenziellen Vorteilen des Edge-Einsatzes sind geringere Rechenkosten ein wichtiger Grund, warum Unternehmen kleinere Modelle als Alternative zu großen Sprachmodellen (LLMs) in Betracht ziehen.
Hinzu kommt, dass kleine Modelle heute weitaus weniger Einschränkungen unterliegen als früher. Anfang dieser Woche hat Mistral sein Angebot an kleinen Modellen mit der Veröffentlichung von Mistral Small 4 aktualisiert, das laut eigenen Angaben für allgemeinen Chat, Programmierung, agentische Aufgaben und Schlussfolgerungen optimiert ist. Das französische Unternehmen hat zudem Forge eingeführt, ein System, mit dem Unternehmen benutzerdefinierte Modelle erstellen können, darunter auch kleine Modelle, bei denen sie die Kompromisse wählen können, die für ihre Anwendungsfälle am besten geeignet sind.
Auch die jüngsten Ergebnisse von Multiverse deuten darauf hin, dass sich die Lücke zu den LLMs schließt. Sein neuestes komprimiertes Modell, HyperNova 60B 2602, basiert auf gpt-oss-120b – einem OpenAI-Modell mit öffentlich verfügbarem Quellcode. Das Unternehmen behauptet, dass es schnellere Antworten zu geringeren Kosten liefert als das Original, von dem es abgeleitet wurde – ein Vorteil, der besonders wichtig für agentische Programmier-Workflows ist, bei denen KI komplexe, mehrstufige Programmieraufgaben autonom bewältigt.
Modelle so klein zu machen, dass sie auf mobilen Geräten laufen und dabei nützlich bleiben, ist eine große Herausforderung. Apple Intelligence umging dies, indem es ein On-Device-Modell mit einem Cloud-Modell kombinierte. Die CompactifAI-App von Multiverse kann Anfragen ebenfalls über eine API an gpt-oss-120b weiterleiten, doch ihr Hauptziel ist es, zu zeigen, dass lokale Modelle wie Gilda und ihre zukünftigen Nachfolger Vorteile bieten, die über Kosteneinsparungen hinausgehen.
Für Mitarbeiter in kritischen Bereichen bietet ein Modell, das lokal ohne Cloud-Verbindung läuft, mehr Datenschutz und Ausfallsicherheit. Der größere Wert liegt jedoch in den geschäftlichen Anwendungsfällen, die dadurch ermöglicht werden – zum Beispiel die Einbettung von KI in Drohnen, Satelliten und andere Umgebungen, in denen keine zuverlässige Verbindung vorausgesetzt werden kann.
Das Unternehmen bedient bereits über 100 globale Kunden, darunter die Bank of Canada, Bosch und Iberdrola, doch der Ausbau seines Kundenstamms könnte ihm helfen, zusätzliche Finanzmittel zu sichern. Nachdem es im vergangenen Jahr eine Serie-B-Finanzierungsrunde in Höhe von 215 Millionen US-Dollar abgeschlossen hat, soll es nun eine neue Finanzierungsrunde über 500 Millionen Euro mit einer Bewertung von über 1,5 Milliarden Euro durchführen.
Verwandter Artikel
Cohere stellt eine Familie von mehrsprachigen Open-Source-KI-Modellen vor
Das auf Unternehmens-KI spezialisierte Unternehmen Cohere hat auf dem derzeit stattfindenden India AI Summit eine neue Familie mehrsprachiger Modelle namens „Tiny Aya“ vorgestellt. Diese Open-Weight-M
Multiverse Computing bringt kostenloses komprimiertes generatives KI-Modell auf den Markt
Große Sprachmodelle stehen vor einer großen Herausforderung: ihrer immensen Größe. Das spanische Start-up Multiverse Computing geht dieses Problem an, indem es komprimierte Modelle entwickelt, die die
Google stellt Gemini Notebooks vor und vereint NotebookLM mit einer persönlichen Wissensdatenbank
Google hat kürzlich die Funktion „Notebooks“ für Gemini eingeführt, die Nutzern helfen soll, komplexe Projekte durch die Erstellung einer personalisierten Wissensdatenbank zu verwalten. Dieses Update
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Angesichts einer Ausfallquote bei privaten Unternehmen von bis zu 9,2 % – dem höchsten Stand seit Jahren – riet die Risikokapitalgesellschaft Lux Capital kürzlich KI-abhängigen Unternehmen dazu, sich schriftliche Zusagen für ihre Rechenkapazitäten zu sichern. Da sich die finanzielle Instabilität in der KI-Lieferkette ausbreitet, warnte Lux, dass eine mündliche Vereinbarung nicht mehr ausreiche.
Es gibt jedoch eine völlig andere Option: die Abhängigkeit von externer Recheninfrastruktur gänzlich aufzugeben. Kleinere KI-Modelle, die direkt auf dem Gerät des Nutzers laufen – ohne Rechenzentrum, ohne Cloud-Anbieter und ohne Kontrahentenrisiko – werden mittlerweile leistungsfähig genug, um ernsthaft in Betracht gezogen zu werden. Und Multiverse Computing tritt hier in den Vordergrund.
Das spanische Start-up hat sich im Vergleich zu einigen Mitbewerbern bisher relativ zurückhaltend gezeigt, doch das ändert sich, da die Nachfrage nach KI-Effizienz stark steigt. Nach der Komprimierung von Modellen großer KI-Labore wie OpenAI, Meta, DeepSeek und Mistral AI hat das Unternehmen zwei Produkte veröffentlicht: eine App, die die Fähigkeiten seiner komprimierten Modelle demonstriert, und ein API-Portal – ein Zugang für Entwickler, um auf diese Modelle zuzugreifen und darauf aufzubauen –, wodurch sie einer breiteren Öffentlichkeit zugänglich gemacht werden.
Die CompactifAI-App, deren Name sich von der quanteninspirierten Komprimierungstechnologie von Multiverse ableitet, ist ein KI-Chat-Tool ähnlich wie ChatGPT oder Mistrals Le Chat. Man stellt eine Frage, und das Modell antwortet. Der Unterschied besteht darin, dass Multiverse Gilda eingebettet hat, ein Modell, das laut Angaben des Unternehmens so kompakt ist, dass es lokal und offline ausgeführt werden kann.

Für Endnutzer bietet dies einen Vorgeschmack auf Edge-KI, bei der Daten ihre Geräte nie verlassen und keine Internetverbindung erforderlich ist. Es gibt jedoch einen Haken: Ihre Mobilgeräte müssen über ausreichend RAM und Speicherplatz verfügen. Ist dies nicht der Fall – und bei vielen älteren iPhones ist dies nicht gegeben –, greift die App über die API auf cloudbasierte Modelle zurück. Die Weiterleitung zwischen lokaler und Cloud-Verarbeitung wird automatisch von einem System übernommen, das Multiverse „Ash Nazg“ nennt – ein Name, den Tolkien-Fans als Anspielung auf die Inschrift des Einen Rings in „Der Herr der Ringe“ erkennen werden. Wenn die App jedoch auf die Cloud umleitet, verliert sie ihren primären Datenschutzvorteil.
Diese Einschränkungen deuten darauf hin, dass CompactifAI noch nicht für eine breite Akzeptanz bei Verbrauchern bereit ist, obwohl dies vielleicht nie die Absicht war. Laut Sensor Tower verzeichnete die App im vergangenen Monat weniger als 5.000 Downloads.
Der eigentliche Fokus liegt auf Unternehmen. Heute startet Multiverse ein Self-Service-API-Portal, das Entwicklern und Unternehmen direkten Zugriff auf seine komprimierten Modelle bietet – ganz ohne AWS Marketplace.
„Das CompactifAI-API-Portal bietet Entwicklern [jetzt] direkten Zugriff auf komprimierte Modelle mit der Transparenz und Kontrolle, die für den Einsatz in der Produktion erforderlich sind“, sagte CEO Enrique Lizaso in einer Erklärung.
Die Echtzeit-Nutzungsüberwachung ist ein zentrales Merkmal der API, und das ist kein Zufall. Neben den potenziellen Vorteilen des Edge-Einsatzes sind geringere Rechenkosten ein wichtiger Grund, warum Unternehmen kleinere Modelle als Alternative zu großen Sprachmodellen (LLMs) in Betracht ziehen.
Hinzu kommt, dass kleine Modelle heute weitaus weniger Einschränkungen unterliegen als früher. Anfang dieser Woche hat Mistral sein Angebot an kleinen Modellen mit der Veröffentlichung von Mistral Small 4 aktualisiert, das laut eigenen Angaben für allgemeinen Chat, Programmierung, agentische Aufgaben und Schlussfolgerungen optimiert ist. Das französische Unternehmen hat zudem Forge eingeführt, ein System, mit dem Unternehmen benutzerdefinierte Modelle erstellen können, darunter auch kleine Modelle, bei denen sie die Kompromisse wählen können, die für ihre Anwendungsfälle am besten geeignet sind.
Auch die jüngsten Ergebnisse von Multiverse deuten darauf hin, dass sich die Lücke zu den LLMs schließt. Sein neuestes komprimiertes Modell, HyperNova 60B 2602, basiert auf gpt-oss-120b – einem OpenAI-Modell mit öffentlich verfügbarem Quellcode. Das Unternehmen behauptet, dass es schnellere Antworten zu geringeren Kosten liefert als das Original, von dem es abgeleitet wurde – ein Vorteil, der besonders wichtig für agentische Programmier-Workflows ist, bei denen KI komplexe, mehrstufige Programmieraufgaben autonom bewältigt.
Modelle so klein zu machen, dass sie auf mobilen Geräten laufen und dabei nützlich bleiben, ist eine große Herausforderung. Apple Intelligence umging dies, indem es ein On-Device-Modell mit einem Cloud-Modell kombinierte. Die CompactifAI-App von Multiverse kann Anfragen ebenfalls über eine API an gpt-oss-120b weiterleiten, doch ihr Hauptziel ist es, zu zeigen, dass lokale Modelle wie Gilda und ihre zukünftigen Nachfolger Vorteile bieten, die über Kosteneinsparungen hinausgehen.
Für Mitarbeiter in kritischen Bereichen bietet ein Modell, das lokal ohne Cloud-Verbindung läuft, mehr Datenschutz und Ausfallsicherheit. Der größere Wert liegt jedoch in den geschäftlichen Anwendungsfällen, die dadurch ermöglicht werden – zum Beispiel die Einbettung von KI in Drohnen, Satelliten und andere Umgebungen, in denen keine zuverlässige Verbindung vorausgesetzt werden kann.
Das Unternehmen bedient bereits über 100 globale Kunden, darunter die Bank of Canada, Bosch und Iberdrola, doch der Ausbau seines Kundenstamms könnte ihm helfen, zusätzliche Finanzmittel zu sichern. Nachdem es im vergangenen Jahr eine Serie-B-Finanzierungsrunde in Höhe von 215 Millionen US-Dollar abgeschlossen hat, soll es nun eine neue Finanzierungsrunde über 500 Millionen Euro mit einer Bewertung von über 1,5 Milliarden Euro durchführen.
Cohere stellt eine Familie von mehrsprachigen Open-Source-KI-Modellen vor
Das auf Unternehmens-KI spezialisierte Unternehmen Cohere hat auf dem derzeit stattfindenden India AI Summit eine neue Familie mehrsprachiger Modelle namens „Tiny Aya“ vorgestellt. Diese Open-Weight-M
Multiverse Computing bringt kostenloses komprimiertes generatives KI-Modell auf den Markt
Große Sprachmodelle stehen vor einer großen Herausforderung: ihrer immensen Größe. Das spanische Start-up Multiverse Computing geht dieses Problem an, indem es komprimierte Modelle entwickelt, die die
Google stellt Gemini Notebooks vor und vereint NotebookLM mit einer persönlichen Wissensdatenbank
Google hat kürzlich die Funktion „Notebooks“ für Gemini eingeführt, die Nutzern helfen soll, komplexe Projekte durch die Erstellung einer personalisierten Wissensdatenbank zu verwalten. Dieses Update





Heim






