Multiverse Computing impulsa la generalización de los modelos de IA comprimidos
Dado que la tasa de impagos de las empresas privadas ha alcanzado el 9,2 % —la más alta en años—, la firma de capital riesgo Lux Capital ha aconsejado recientemente a las empresas que dependen de la IA que obtengan compromisos por escrito respecto a su capacidad de computación. A medida que la inestabilidad financiera se extiende por la cadena de suministro de la IA, Lux ha advertido de que un acuerdo verbal ya no es suficiente.
Pero existe una opción completamente diferente: abandonar por completo la dependencia de la infraestructura informática externa. Los modelos de IA más pequeños que se ejecutan directamente en el dispositivo del usuario —sin centro de datos, sin proveedor de nube y sin riesgo de contraparte— están adquiriendo la capacidad suficiente como para merecer una consideración seria. Y Multiverse Computing está dando un paso al frente.
Esta startup española ha mantenido un perfil relativamente bajo en comparación con algunos competidores, pero eso está cambiando a medida que aumenta la demanda de eficiencia en IA. Tras comprimir modelos de los principales laboratorios de IA, como OpenAI, Meta, DeepSeek y Mistral AI, ha lanzado dos productos: una aplicación que demuestra las capacidades de sus modelos comprimidos y un portal de API —una pasarela para que los desarrolladores accedan a esos modelos y los utilicen como base—, lo que los hace más accesibles.
La aplicación CompactifAI, que toma su nombre de la tecnología de compresión inspirada en la cuántica de Multiverse, es una herramienta de chat con IA similar a ChatGPT o a Le Chat de Mistral. Haces una pregunta y el modelo responde. La diferencia es que Multiverse ha integrado Gilda, un modelo tan compacto que puede ejecutarse localmente y sin conexión, según la empresa.

Para los usuarios finales, esto ofrece una muestra de la IA de vanguardia, en la que los datos nunca salen de sus dispositivos y no se requiere conexión a Internet. Sin embargo, hay una trampa: sus dispositivos móviles deben tener suficiente RAM y almacenamiento. Si no es así —y muchos iPhones antiguos no lo tienen—, la aplicación recurre a modelos basados en la nube a través de la API. El enrutamiento entre el procesamiento local y el de la nube lo gestiona automáticamente un sistema que Multiverse denomina Ash Nazg, un nombre que los fans de Tolkien reconocerán como una referencia a la inscripción del Anillo Único en «El Señor de los Anillos». Pero cuando la aplicación se redirige a la nube, pierde su principal ventaja en materia de privacidad.
Estas limitaciones sugieren que CompactifAI aún no está lista para una adopción generalizada por parte de los consumidores, aunque puede que esa nunca haya sido la intención. Según Sensor Tower, la aplicación ha registrado menos de 5000 descargas en el último mes.
El verdadero objetivo son las empresas. Hoy, Multiverse lanza un portal de API de autoservicio que proporciona a los desarrolladores y a las empresas acceso directo a sus modelos comprimidos, sin necesidad de AWS Marketplace.
«El portal de la API de CompactifAI [ahora] ofrece a los desarrolladores acceso directo a modelos comprimidos con la transparencia y el control necesarios para ejecutarlos en producción», afirmó el director ejecutivo Enrique Lizaso en un comunicado.
La supervisión del uso en tiempo real es una característica clave de la API, y no es casualidad. Junto con los beneficios potenciales de la implementación en el borde, los menores costes de computación son una de las principales razones por las que las empresas están explorando modelos más pequeños como alternativa a los grandes modelos de lenguaje (LLM).
También ayuda que los modelos pequeños estén mucho menos limitados de lo que solían estar. A principios de esta semana, Mistral actualizó su gama de modelos pequeños con el lanzamiento de Mistral Small 4, que, según afirma, está optimizado para el chat general, la programación, las tareas de agente y el razonamiento. La empresa francesa también lanzó Forge, un sistema que permite a las empresas crear modelos personalizados, incluidos modelos pequeños en los que pueden elegir las compensaciones que mejor se adapten a sus casos de uso.
Los resultados recientes de Multiverse también indican que la brecha con los LLM se está reduciendo. Su último modelo comprimido, HyperNova 60B 2602, se basa en gpt-oss-120b, un modelo de OpenAI cuyo código subyacente está disponible públicamente. La empresa afirma que ofrece respuestas más rápidas a un coste menor que el original del que se deriva, una ventaja especialmente importante para los flujos de trabajo de codificación autónoma, en los que la IA gestiona de forma autónoma tareas de programación complejas y de varios pasos.
Hacer que los modelos sean lo suficientemente pequeños como para ejecutarse en dispositivos móviles sin dejar de ser útiles supone un reto importante. Apple Intelligence lo ha sorteado combinando un modelo en el dispositivo con uno en la nube. La aplicación CompactifAI de Multiverse también puede redirigir las solicitudes a gpt-oss-120b a través de una API, pero su objetivo principal es demostrar que los modelos locales como Gilda y sus futuros sucesores ofrecen ventajas más allá del ahorro de costes.
Para los trabajadores de sectores críticos, un modelo que se ejecuta localmente sin conexión a la nube ofrece mayor privacidad y resiliencia. Pero el mayor valor reside en los casos de uso empresarial que esto permite —por ejemplo, la integración de la IA en drones, satélites y otros entornos en los que no se puede dar por sentada una conectividad fiable.
La empresa ya presta servicio a más de 100 clientes globales, entre los que se incluyen el Banco de Canadá, Bosch e Iberdrola, pero ampliar su base de clientes podría ayudarla a conseguir financiación adicional. Tras recaudar 215 millones de dólares en una ronda de financiación de serie B el año pasado, según se informa, ahora está recaudando una nueva ronda de financiación de 500 millones de euros con una valoración que supera los 1.500 millones de euros.
Artículo relacionado
Cohere presenta una familia de modelos de IA multilingües de código abierto
La empresa de IA empresarial Cohere ha presentado una nueva familia de modelos multilingües, denominada Tiny Aya, durante la Cumbre de IA de la India que se está celebrando estos días. Estos modelos d
Multiverse Computing lanza un modelo generativo de IA comprimido gratuito
Los modelos lingüísticos de gran tamaño se enfrentan a un reto importante: su inmenso tamaño. La startup española Multiverse Computing está abordando este problema mediante la creación de modelos comp
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Dado que la tasa de impagos de las empresas privadas ha alcanzado el 9,2 % —la más alta en años—, la firma de capital riesgo Lux Capital ha aconsejado recientemente a las empresas que dependen de la IA que obtengan compromisos por escrito respecto a su capacidad de computación. A medida que la inestabilidad financiera se extiende por la cadena de suministro de la IA, Lux ha advertido de que un acuerdo verbal ya no es suficiente.
Pero existe una opción completamente diferente: abandonar por completo la dependencia de la infraestructura informática externa. Los modelos de IA más pequeños que se ejecutan directamente en el dispositivo del usuario —sin centro de datos, sin proveedor de nube y sin riesgo de contraparte— están adquiriendo la capacidad suficiente como para merecer una consideración seria. Y Multiverse Computing está dando un paso al frente.
Esta startup española ha mantenido un perfil relativamente bajo en comparación con algunos competidores, pero eso está cambiando a medida que aumenta la demanda de eficiencia en IA. Tras comprimir modelos de los principales laboratorios de IA, como OpenAI, Meta, DeepSeek y Mistral AI, ha lanzado dos productos: una aplicación que demuestra las capacidades de sus modelos comprimidos y un portal de API —una pasarela para que los desarrolladores accedan a esos modelos y los utilicen como base—, lo que los hace más accesibles.
La aplicación CompactifAI, que toma su nombre de la tecnología de compresión inspirada en la cuántica de Multiverse, es una herramienta de chat con IA similar a ChatGPT o a Le Chat de Mistral. Haces una pregunta y el modelo responde. La diferencia es que Multiverse ha integrado Gilda, un modelo tan compacto que puede ejecutarse localmente y sin conexión, según la empresa.

Para los usuarios finales, esto ofrece una muestra de la IA de vanguardia, en la que los datos nunca salen de sus dispositivos y no se requiere conexión a Internet. Sin embargo, hay una trampa: sus dispositivos móviles deben tener suficiente RAM y almacenamiento. Si no es así —y muchos iPhones antiguos no lo tienen—, la aplicación recurre a modelos basados en la nube a través de la API. El enrutamiento entre el procesamiento local y el de la nube lo gestiona automáticamente un sistema que Multiverse denomina Ash Nazg, un nombre que los fans de Tolkien reconocerán como una referencia a la inscripción del Anillo Único en «El Señor de los Anillos». Pero cuando la aplicación se redirige a la nube, pierde su principal ventaja en materia de privacidad.
Estas limitaciones sugieren que CompactifAI aún no está lista para una adopción generalizada por parte de los consumidores, aunque puede que esa nunca haya sido la intención. Según Sensor Tower, la aplicación ha registrado menos de 5000 descargas en el último mes.
El verdadero objetivo son las empresas. Hoy, Multiverse lanza un portal de API de autoservicio que proporciona a los desarrolladores y a las empresas acceso directo a sus modelos comprimidos, sin necesidad de AWS Marketplace.
«El portal de la API de CompactifAI [ahora] ofrece a los desarrolladores acceso directo a modelos comprimidos con la transparencia y el control necesarios para ejecutarlos en producción», afirmó el director ejecutivo Enrique Lizaso en un comunicado.
La supervisión del uso en tiempo real es una característica clave de la API, y no es casualidad. Junto con los beneficios potenciales de la implementación en el borde, los menores costes de computación son una de las principales razones por las que las empresas están explorando modelos más pequeños como alternativa a los grandes modelos de lenguaje (LLM).
También ayuda que los modelos pequeños estén mucho menos limitados de lo que solían estar. A principios de esta semana, Mistral actualizó su gama de modelos pequeños con el lanzamiento de Mistral Small 4, que, según afirma, está optimizado para el chat general, la programación, las tareas de agente y el razonamiento. La empresa francesa también lanzó Forge, un sistema que permite a las empresas crear modelos personalizados, incluidos modelos pequeños en los que pueden elegir las compensaciones que mejor se adapten a sus casos de uso.
Los resultados recientes de Multiverse también indican que la brecha con los LLM se está reduciendo. Su último modelo comprimido, HyperNova 60B 2602, se basa en gpt-oss-120b, un modelo de OpenAI cuyo código subyacente está disponible públicamente. La empresa afirma que ofrece respuestas más rápidas a un coste menor que el original del que se deriva, una ventaja especialmente importante para los flujos de trabajo de codificación autónoma, en los que la IA gestiona de forma autónoma tareas de programación complejas y de varios pasos.
Hacer que los modelos sean lo suficientemente pequeños como para ejecutarse en dispositivos móviles sin dejar de ser útiles supone un reto importante. Apple Intelligence lo ha sorteado combinando un modelo en el dispositivo con uno en la nube. La aplicación CompactifAI de Multiverse también puede redirigir las solicitudes a gpt-oss-120b a través de una API, pero su objetivo principal es demostrar que los modelos locales como Gilda y sus futuros sucesores ofrecen ventajas más allá del ahorro de costes.
Para los trabajadores de sectores críticos, un modelo que se ejecuta localmente sin conexión a la nube ofrece mayor privacidad y resiliencia. Pero el mayor valor reside en los casos de uso empresarial que esto permite —por ejemplo, la integración de la IA en drones, satélites y otros entornos en los que no se puede dar por sentada una conectividad fiable.
La empresa ya presta servicio a más de 100 clientes globales, entre los que se incluyen el Banco de Canadá, Bosch e Iberdrola, pero ampliar su base de clientes podría ayudarla a conseguir financiación adicional. Tras recaudar 215 millones de dólares en una ronda de financiación de serie B el año pasado, según se informa, ahora está recaudando una nueva ronda de financiación de 500 millones de euros con una valoración que supera los 1.500 millones de euros.
Cohere presenta una familia de modelos de IA multilingües de código abierto
La empresa de IA empresarial Cohere ha presentado una nueva familia de modelos multilingües, denominada Tiny Aya, durante la Cumbre de IA de la India que se está celebrando estos días. Estos modelos d
Multiverse Computing lanza un modelo generativo de IA comprimido gratuito
Los modelos lingüísticos de gran tamaño se enfrentan a un reto importante: su inmenso tamaño. La startup española Multiverse Computing está abordando este problema mediante la creación de modelos comp
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf





Hogar






