A computação multiverso impulsiona a adoção generalizada de modelos de IA compactados
Com a taxa de inadimplência das empresas privadas chegando a 9,2% — a mais alta em anos —, a empresa de capital de risco Lux Capital aconselhou recentemente as empresas que dependem de IA a garantirem compromissos por escrito para sua capacidade computacional. À medida que a instabilidade financeira se espalha pela cadeia de suprimentos de IA, a Lux alertou que um acordo verbal não é mais suficiente.
Mas há uma opção completamente diferente: abandonar totalmente a dependência de infraestrutura de computação externa. Modelos de IA menores que rodam diretamente no dispositivo do usuário — sem data center, sem provedor de nuvem e sem risco de contraparte — estão se tornando capazes o suficiente para merecerem consideração séria. E a Multiverse Computing está dando um passo à frente.
A startup espanhola tem mantido um perfil relativamente discreto em comparação com alguns concorrentes, mas isso está mudando à medida que a demanda por eficiência em IA cresce. Após compactar modelos de grandes laboratórios de IA, como OpenAI, Meta, DeepSeek e Mistral AI, ela lançou dois produtos: um aplicativo que demonstra as capacidades de seus modelos compactados e um portal de API — um gateway para desenvolvedores acessarem e trabalharem com esses modelos — tornando-os mais amplamente disponíveis.
O aplicativo CompactifAI, que leva o nome da tecnologia de compressão inspirada na mecânica quântica da Multiverse, é uma ferramenta de chat de IA semelhante ao ChatGPT ou ao Le Chat da Mistral. Você faz uma pergunta e o modelo responde. A diferença é que a Multiverse incorporou o Gilda, um modelo tão compacto que pode ser executado localmente e offline, de acordo com a empresa.

Para os usuários finais, isso oferece uma amostra da IA de ponta, em que os dados nunca saem de seus dispositivos e não é necessária conexão com a internet. No entanto, há um porém: seus dispositivos móveis devem ter RAM e armazenamento suficientes. Se não tiverem — e muitos iPhones mais antigos não têm —, o aplicativo recorre a modelos baseados na nuvem via API. O roteamento entre o processamento local e na nuvem é feito automaticamente por um sistema que a Multiverse chama de Ash Nazg, um nome que os fãs de Tolkien reconhecerão como uma referência à inscrição do Anel Único em “O Senhor dos Anéis”. Mas quando o aplicativo é redirecionado para a nuvem, ele perde sua principal vantagem em termos de privacidade.
Essas limitações sugerem que o CompactifAI ainda não está pronto para ampla adoção pelos consumidores, embora essa talvez nunca tenha sido a intenção. De acordo com a Sensor Tower, o aplicativo registrou menos de 5.000 downloads no mês passado.
O verdadeiro foco são as empresas. Hoje, a Multiverse está lançando um portal de API de autoatendimento que oferece a desenvolvedores e empresas acesso direto aos seus modelos compactados — sem a necessidade do AWS Marketplace.
“O portal de API do CompactifAI [agora] oferece aos desenvolvedores acesso direto a modelos compactados com a transparência e o controle necessários para executá-los em produção”, disse o CEO Enrique Lizaso em um comunicado.
O monitoramento de uso em tempo real é um recurso fundamental da API, e isso não é coincidência. Juntamente com os benefícios potenciais da implantação na borda, os custos de computação mais baixos são uma das principais razões pelas quais as empresas estão explorando modelos menores como alternativa aos grandes modelos de linguagem (LLMs).
Também ajuda o fato de que os modelos pequenos estão muito menos limitados do que antes. No início desta semana, a Mistral atualizou sua linha de modelos pequenos com o lançamento do Mistral Small 4, que, segundo a empresa, é otimizado para bate-papo geral, programação, tarefas de agência e raciocínio. A empresa francesa também lançou o Forge, um sistema que permite que as empresas criem modelos personalizados, incluindo modelos pequenos nos quais podem escolher as compensações que melhor se adaptam aos seus casos de uso.
Os resultados recentes da Multiverse também indicam que a diferença em relação aos LLMs está diminuindo. Seu mais recente modelo compactado, o HyperNova 60B 2602, é baseado no gpt-oss-120b — um modelo da OpenAI com código-fonte disponível publicamente. A empresa afirma que ele oferece respostas mais rápidas a um custo menor do que o original do qual foi derivado, uma vantagem especialmente importante para fluxos de trabalho de codificação autônoma, nos quais a IA lida de forma autônoma com tarefas de programação complexas e de várias etapas.
Tornar os modelos pequenos o suficiente para rodarem em dispositivos móveis sem perder a utilidade é um desafio significativo. A Apple Intelligence contornou isso combinando um modelo no dispositivo com um modelo na nuvem. O aplicativo CompactifAI da Multiverse também pode encaminhar solicitações para o gpt-oss-120b via API, mas seu objetivo principal é demonstrar que modelos locais como o Gilda e seus futuros sucessores oferecem vantagens além da economia de custos.
Para profissionais em áreas críticas, um modelo que roda localmente sem conectividade à nuvem oferece maior privacidade e resiliência. Mas o maior valor reside nos casos de uso empresarial que isso possibilita — por exemplo, a integração de IA em drones, satélites e outros ambientes onde não se pode presumir conectividade confiável.
A empresa já atende a mais de 100 clientes globais, incluindo o Banco do Canadá, a Bosch e a Iberdrola, mas expandir sua base de clientes poderia ajudá-la a garantir financiamento adicional. Depois de levantar US$ 215 milhões na Série B no ano passado, ela agora estaria levantando uma nova rodada de financiamento de € 500 milhões com uma avaliação superior a € 1,5 bilhão.
Artigo relacionado
A Cohere apresenta uma família de modelos de IA multilíngues de código aberto
A empresa de IA empresarial Cohere revelou uma nova família de modelos multilíngues, chamada Tiny Aya, durante a India AI Summit, que está ocorrendo neste momento. Esses modelos de código aberto — o q
Multiverse Computing lança modelo gratuito de IA generativa compactada
Os grandes modelos de linguagem enfrentam um desafio significativo: seu tamanho imenso. A startup espanhola Multiverse Computing está enfrentando esse problema com a criação de modelos compactados, pr
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Recomendações de tópicos especiais relacionados
Comentários (0)
Com a taxa de inadimplência das empresas privadas chegando a 9,2% — a mais alta em anos —, a empresa de capital de risco Lux Capital aconselhou recentemente as empresas que dependem de IA a garantirem compromissos por escrito para sua capacidade computacional. À medida que a instabilidade financeira se espalha pela cadeia de suprimentos de IA, a Lux alertou que um acordo verbal não é mais suficiente.
Mas há uma opção completamente diferente: abandonar totalmente a dependência de infraestrutura de computação externa. Modelos de IA menores que rodam diretamente no dispositivo do usuário — sem data center, sem provedor de nuvem e sem risco de contraparte — estão se tornando capazes o suficiente para merecerem consideração séria. E a Multiverse Computing está dando um passo à frente.
A startup espanhola tem mantido um perfil relativamente discreto em comparação com alguns concorrentes, mas isso está mudando à medida que a demanda por eficiência em IA cresce. Após compactar modelos de grandes laboratórios de IA, como OpenAI, Meta, DeepSeek e Mistral AI, ela lançou dois produtos: um aplicativo que demonstra as capacidades de seus modelos compactados e um portal de API — um gateway para desenvolvedores acessarem e trabalharem com esses modelos — tornando-os mais amplamente disponíveis.
O aplicativo CompactifAI, que leva o nome da tecnologia de compressão inspirada na mecânica quântica da Multiverse, é uma ferramenta de chat de IA semelhante ao ChatGPT ou ao Le Chat da Mistral. Você faz uma pergunta e o modelo responde. A diferença é que a Multiverse incorporou o Gilda, um modelo tão compacto que pode ser executado localmente e offline, de acordo com a empresa.

Para os usuários finais, isso oferece uma amostra da IA de ponta, em que os dados nunca saem de seus dispositivos e não é necessária conexão com a internet. No entanto, há um porém: seus dispositivos móveis devem ter RAM e armazenamento suficientes. Se não tiverem — e muitos iPhones mais antigos não têm —, o aplicativo recorre a modelos baseados na nuvem via API. O roteamento entre o processamento local e na nuvem é feito automaticamente por um sistema que a Multiverse chama de Ash Nazg, um nome que os fãs de Tolkien reconhecerão como uma referência à inscrição do Anel Único em “O Senhor dos Anéis”. Mas quando o aplicativo é redirecionado para a nuvem, ele perde sua principal vantagem em termos de privacidade.
Essas limitações sugerem que o CompactifAI ainda não está pronto para ampla adoção pelos consumidores, embora essa talvez nunca tenha sido a intenção. De acordo com a Sensor Tower, o aplicativo registrou menos de 5.000 downloads no mês passado.
O verdadeiro foco são as empresas. Hoje, a Multiverse está lançando um portal de API de autoatendimento que oferece a desenvolvedores e empresas acesso direto aos seus modelos compactados — sem a necessidade do AWS Marketplace.
“O portal de API do CompactifAI [agora] oferece aos desenvolvedores acesso direto a modelos compactados com a transparência e o controle necessários para executá-los em produção”, disse o CEO Enrique Lizaso em um comunicado.
O monitoramento de uso em tempo real é um recurso fundamental da API, e isso não é coincidência. Juntamente com os benefícios potenciais da implantação na borda, os custos de computação mais baixos são uma das principais razões pelas quais as empresas estão explorando modelos menores como alternativa aos grandes modelos de linguagem (LLMs).
Também ajuda o fato de que os modelos pequenos estão muito menos limitados do que antes. No início desta semana, a Mistral atualizou sua linha de modelos pequenos com o lançamento do Mistral Small 4, que, segundo a empresa, é otimizado para bate-papo geral, programação, tarefas de agência e raciocínio. A empresa francesa também lançou o Forge, um sistema que permite que as empresas criem modelos personalizados, incluindo modelos pequenos nos quais podem escolher as compensações que melhor se adaptam aos seus casos de uso.
Os resultados recentes da Multiverse também indicam que a diferença em relação aos LLMs está diminuindo. Seu mais recente modelo compactado, o HyperNova 60B 2602, é baseado no gpt-oss-120b — um modelo da OpenAI com código-fonte disponível publicamente. A empresa afirma que ele oferece respostas mais rápidas a um custo menor do que o original do qual foi derivado, uma vantagem especialmente importante para fluxos de trabalho de codificação autônoma, nos quais a IA lida de forma autônoma com tarefas de programação complexas e de várias etapas.
Tornar os modelos pequenos o suficiente para rodarem em dispositivos móveis sem perder a utilidade é um desafio significativo. A Apple Intelligence contornou isso combinando um modelo no dispositivo com um modelo na nuvem. O aplicativo CompactifAI da Multiverse também pode encaminhar solicitações para o gpt-oss-120b via API, mas seu objetivo principal é demonstrar que modelos locais como o Gilda e seus futuros sucessores oferecem vantagens além da economia de custos.
Para profissionais em áreas críticas, um modelo que roda localmente sem conectividade à nuvem oferece maior privacidade e resiliência. Mas o maior valor reside nos casos de uso empresarial que isso possibilita — por exemplo, a integração de IA em drones, satélites e outros ambientes onde não se pode presumir conectividade confiável.
A empresa já atende a mais de 100 clientes globais, incluindo o Banco do Canadá, a Bosch e a Iberdrola, mas expandir sua base de clientes poderia ajudá-la a garantir financiamento adicional. Depois de levantar US$ 215 milhões na Série B no ano passado, ela agora estaria levantando uma nova rodada de financiamento de € 500 milhões com uma avaliação superior a € 1,5 bilhão.
A Cohere apresenta uma família de modelos de IA multilíngues de código aberto
A empresa de IA empresarial Cohere revelou uma nova família de modelos multilíngues, chamada Tiny Aya, durante a India AI Summit, que está ocorrendo neste momento. Esses modelos de código aberto — o q
Multiverse Computing lança modelo gratuito de IA generativa compactada
Os grandes modelos de linguagem enfrentam um desafio significativo: seu tamanho imenso. A startup espanhola Multiverse Computing está enfrentando esse problema com a criação de modelos compactados, pr
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam





Lar






