Maison
Multiverse Computing fait entrer les modèles d'IA compressés dans le courant dominant
Alors que le taux de défaillance des entreprises privées atteint 9,2 % — son plus haut niveau depuis des années —, la société de capital-risque Lux Capital a récemment conseillé aux entreprises dépendantes de l'IA d'obtenir des engagements écrits concernant leur capacité de calcul. Alors que l'instabilité financière se propage dans la chaîne d'approvisionnement de l'IA, Lux a averti qu'un accord verbal ne suffisait plus.
Mais il existe une option totalement différente : abandonner complètement le recours à une infrastructure de calcul externe. Les modèles d'IA plus petits qui s'exécutent directement sur l'appareil de l'utilisateur — sans centre de données, sans fournisseur de cloud et sans risque de contrepartie — deviennent suffisamment performants pour mériter d'être sérieusement pris en considération. Et Multiverse Computing se positionne sur ce marché.
La start-up espagnole a jusqu’à présent fait profil bas par rapport à certains concurrents, mais cela est en train de changer à mesure que la demande en matière d’efficacité de l’IA explose. Après avoir compressé des modèles provenant de grands laboratoires d’IA tels qu’OpenAI, Meta, DeepSeek et Mistral AI, elle a lancé deux produits : une application qui démontre les capacités de ses modèles compressés, et un portail API — une passerelle permettant aux développeurs d’accéder à ces modèles et de s’en servir comme base — les rendant ainsi plus largement accessibles.
L'application CompactifAI, qui tire son nom de la technologie de compression inspirée de la physique quantique de Multiverse, est un outil de chat IA similaire à ChatGPT ou à Le Chat de Mistral. Vous posez une question, et le modèle y répond. La différence est que Multiverse a intégré Gilda, un modèle si compact qu'il peut fonctionner localement et hors ligne, selon l'entreprise.

Pour les utilisateurs finaux, cela offre un avant-goût de l’IA en périphérie, où les données ne quittent jamais leurs appareils et où aucune connexion Internet n’est requise. Il y a toutefois un hic : leurs appareils mobiles doivent disposer d’une mémoire vive (RAM) et d’un espace de stockage suffisants. Si ce n’est pas le cas — et ce sera souvent le cas pour de nombreux anciens iPhone —, l’application se rabat sur des modèles basés sur le cloud via l’API. Le routage entre le traitement local et le traitement dans le cloud est géré automatiquement par un système que Multiverse appelle Ash Nazg, un nom que les fans de Tolkien reconnaîtront comme une référence à l’inscription sur l’Anneau Unique dans « Le Seigneur des Anneaux ». Mais lorsque l’application bascule vers le cloud, elle perd son principal avantage en matière de confidentialité.
Ces limitations suggèrent que CompactifAI n'est pas encore prête à être adoptée à grande échelle par les consommateurs, même si cela n'a peut-être jamais été l'intention. Selon Sensor Tower, l'application a enregistré moins de 5 000 téléchargements au cours du mois dernier.
Le véritable objectif, ce sont les entreprises. Aujourd’hui, Multiverse lance un portail API en libre-service qui offre aux développeurs et aux entreprises un accès direct à ses modèles compressés — sans passer par AWS Marketplace.
« Le portail API de CompactifAI offre [désormais] aux développeurs un accès direct aux modèles compressés, avec la transparence et le contrôle nécessaires pour les exploiter en production », a déclaré le PDG Enrique Lizaso dans un communiqué.
La surveillance de l’utilisation en temps réel est une fonctionnalité clé de l’API, et ce n’est pas un hasard. Outre les avantages potentiels du déploiement en périphérie, la réduction des coûts de calcul est l’une des principales raisons pour lesquelles les entreprises explorent des modèles plus petits comme alternative aux grands modèles linguistiques (LLM).
Le fait que les petits modèles soient bien moins limités qu’auparavant est également un atout. En début de semaine, Mistral a mis à jour sa gamme de petits modèles avec la sortie de Mistral Small 4, qui, selon l’entreprise, est optimisé pour le chat général, le codage, les tâches agentiques et le raisonnement. La société française a également lancé Forge, un système permettant aux entreprises de créer des modèles personnalisés, y compris des petits modèles pour lesquels elles peuvent choisir les compromis les mieux adaptés à leurs cas d’utilisation.
Les résultats récents de Multiverse indiquent également que l'écart avec les LLM se réduit. Son dernier modèle compressé, HyperNova 60B 2602, est basé sur gpt-oss-120b — un modèle OpenAI dont le code source est accessible au public. La société affirme qu'il offre des réponses plus rapides à moindre coût que le modèle original dont il est dérivé, un avantage particulièrement important pour les workflows de codage agentique, où l'IA gère de manière autonome des tâches de programmation complexes en plusieurs étapes.
Rendre les modèles suffisamment légers pour fonctionner sur des appareils mobiles tout en restant utiles constitue un défi de taille. Apple Intelligence a contourné ce problème en combinant un modèle sur appareil avec un modèle cloud. L'application CompactifAI de Multiverse peut également acheminer les requêtes vers gpt-oss-120b via une API, mais son objectif principal est de démontrer que les modèles locaux comme Gilda et ses futurs successeurs offrent des avantages allant au-delà des économies de coûts.
Pour les professionnels des secteurs critiques, un modèle fonctionnant localement sans connexion au cloud offre une confidentialité et une résilience accrues. Mais la valeur ajoutée réside davantage dans les cas d'utilisation professionnels que cela permet — par exemple, l'intégration de l'IA dans des drones, des satellites et d'autres environnements où une connectivité fiable ne peut être garantie.
L'entreprise compte déjà plus de 100 clients à l'échelle mondiale, dont la Banque du Canada, Bosch et Iberdrola, mais l'élargissement de sa clientèle pourrait l'aider à obtenir des financements supplémentaires. Après avoir levé 215 millions de dollars lors d'une série B l'année dernière, elle serait actuellement en train de lever un nouveau tour de table de 500 millions d'euros, avec une valorisation dépassant 1,5 milliard d'euros.
Article connexe
Cohere dévoile une gamme de modèles d'IA multilingues open source
La société d'IA d'entreprise Cohere a dévoilé une nouvelle famille de modèles multilingues, baptisée « Tiny Aya », lors du Sommet indien sur l'IA qui se tient actuellement. Ces modèles
Multiverse Computing lance un modèle d'IA générative compressé gratuit
Les grands modèles linguistiques sont confrontés à un défi de taille : leur taille immense. La start-up espagnole Multiverse Computing s'attaque à ce problème en créant des modèles compressés con
OpenAI modifie discrètement ses statuts pour compliquer le licenciement d'Altman
À la suite de l'incident de 2023, qui s'apparentait à un coup d'État, OpenAI a encore renforcé les protections dont bénéficie son PDG, Sam Altman, en mettant à jour ses statuts. Des doc
Recommandations de sujets spéciaux liés
commentaires (0)
Alors que le taux de défaillance des entreprises privées atteint 9,2 % — son plus haut niveau depuis des années —, la société de capital-risque Lux Capital a récemment conseillé aux entreprises dépendantes de l'IA d'obtenir des engagements écrits concernant leur capacité de calcul. Alors que l'instabilité financière se propage dans la chaîne d'approvisionnement de l'IA, Lux a averti qu'un accord verbal ne suffisait plus.
Mais il existe une option totalement différente : abandonner complètement le recours à une infrastructure de calcul externe. Les modèles d'IA plus petits qui s'exécutent directement sur l'appareil de l'utilisateur — sans centre de données, sans fournisseur de cloud et sans risque de contrepartie — deviennent suffisamment performants pour mériter d'être sérieusement pris en considération. Et Multiverse Computing se positionne sur ce marché.
La start-up espagnole a jusqu’à présent fait profil bas par rapport à certains concurrents, mais cela est en train de changer à mesure que la demande en matière d’efficacité de l’IA explose. Après avoir compressé des modèles provenant de grands laboratoires d’IA tels qu’OpenAI, Meta, DeepSeek et Mistral AI, elle a lancé deux produits : une application qui démontre les capacités de ses modèles compressés, et un portail API — une passerelle permettant aux développeurs d’accéder à ces modèles et de s’en servir comme base — les rendant ainsi plus largement accessibles.
L'application CompactifAI, qui tire son nom de la technologie de compression inspirée de la physique quantique de Multiverse, est un outil de chat IA similaire à ChatGPT ou à Le Chat de Mistral. Vous posez une question, et le modèle y répond. La différence est que Multiverse a intégré Gilda, un modèle si compact qu'il peut fonctionner localement et hors ligne, selon l'entreprise.

Pour les utilisateurs finaux, cela offre un avant-goût de l’IA en périphérie, où les données ne quittent jamais leurs appareils et où aucune connexion Internet n’est requise. Il y a toutefois un hic : leurs appareils mobiles doivent disposer d’une mémoire vive (RAM) et d’un espace de stockage suffisants. Si ce n’est pas le cas — et ce sera souvent le cas pour de nombreux anciens iPhone —, l’application se rabat sur des modèles basés sur le cloud via l’API. Le routage entre le traitement local et le traitement dans le cloud est géré automatiquement par un système que Multiverse appelle Ash Nazg, un nom que les fans de Tolkien reconnaîtront comme une référence à l’inscription sur l’Anneau Unique dans « Le Seigneur des Anneaux ». Mais lorsque l’application bascule vers le cloud, elle perd son principal avantage en matière de confidentialité.
Ces limitations suggèrent que CompactifAI n'est pas encore prête à être adoptée à grande échelle par les consommateurs, même si cela n'a peut-être jamais été l'intention. Selon Sensor Tower, l'application a enregistré moins de 5 000 téléchargements au cours du mois dernier.
Le véritable objectif, ce sont les entreprises. Aujourd’hui, Multiverse lance un portail API en libre-service qui offre aux développeurs et aux entreprises un accès direct à ses modèles compressés — sans passer par AWS Marketplace.
« Le portail API de CompactifAI offre [désormais] aux développeurs un accès direct aux modèles compressés, avec la transparence et le contrôle nécessaires pour les exploiter en production », a déclaré le PDG Enrique Lizaso dans un communiqué.
La surveillance de l’utilisation en temps réel est une fonctionnalité clé de l’API, et ce n’est pas un hasard. Outre les avantages potentiels du déploiement en périphérie, la réduction des coûts de calcul est l’une des principales raisons pour lesquelles les entreprises explorent des modèles plus petits comme alternative aux grands modèles linguistiques (LLM).
Le fait que les petits modèles soient bien moins limités qu’auparavant est également un atout. En début de semaine, Mistral a mis à jour sa gamme de petits modèles avec la sortie de Mistral Small 4, qui, selon l’entreprise, est optimisé pour le chat général, le codage, les tâches agentiques et le raisonnement. La société française a également lancé Forge, un système permettant aux entreprises de créer des modèles personnalisés, y compris des petits modèles pour lesquels elles peuvent choisir les compromis les mieux adaptés à leurs cas d’utilisation.
Les résultats récents de Multiverse indiquent également que l'écart avec les LLM se réduit. Son dernier modèle compressé, HyperNova 60B 2602, est basé sur gpt-oss-120b — un modèle OpenAI dont le code source est accessible au public. La société affirme qu'il offre des réponses plus rapides à moindre coût que le modèle original dont il est dérivé, un avantage particulièrement important pour les workflows de codage agentique, où l'IA gère de manière autonome des tâches de programmation complexes en plusieurs étapes.
Rendre les modèles suffisamment légers pour fonctionner sur des appareils mobiles tout en restant utiles constitue un défi de taille. Apple Intelligence a contourné ce problème en combinant un modèle sur appareil avec un modèle cloud. L'application CompactifAI de Multiverse peut également acheminer les requêtes vers gpt-oss-120b via une API, mais son objectif principal est de démontrer que les modèles locaux comme Gilda et ses futurs successeurs offrent des avantages allant au-delà des économies de coûts.
Pour les professionnels des secteurs critiques, un modèle fonctionnant localement sans connexion au cloud offre une confidentialité et une résilience accrues. Mais la valeur ajoutée réside davantage dans les cas d'utilisation professionnels que cela permet — par exemple, l'intégration de l'IA dans des drones, des satellites et d'autres environnements où une connectivité fiable ne peut être garantie.
L'entreprise compte déjà plus de 100 clients à l'échelle mondiale, dont la Banque du Canada, Bosch et Iberdrola, mais l'élargissement de sa clientèle pourrait l'aider à obtenir des financements supplémentaires. Après avoir levé 215 millions de dollars lors d'une série B l'année dernière, elle serait actuellement en train de lever un nouveau tour de table de 500 millions d'euros, avec une valorisation dépassant 1,5 milliard d'euros.
Cohere dévoile une gamme de modèles d'IA multilingues open source
La société d'IA d'entreprise Cohere a dévoilé une nouvelle famille de modèles multilingues, baptisée « Tiny Aya », lors du Sommet indien sur l'IA qui se tient actuellement. Ces modèles
Multiverse Computing lance un modèle d'IA générative compressé gratuit
Les grands modèles linguistiques sont confrontés à un défi de taille : leur taille immense. La start-up espagnole Multiverse Computing s'attaque à ce problème en créant des modèles compressés con
OpenAI modifie discrètement ses statuts pour compliquer le licenciement d'Altman
À la suite de l'incident de 2023, qui s'apparentait à un coup d'État, OpenAI a encore renforcé les protections dont bénéficie son PDG, Sam Altman, en mettant à jour ses statuts. Des doc











