Deep Cogito revela quatro modelos de raciocínio híbrido de código aberto com intuição autoaperfeiçoável

Lar

Notícias

21 de Fevereiro de 2026

AnthonyRoberts

101

A Deep Cogito, uma startup de pesquisa em IA sediada em São Francisco e fundada por ex-engenheiros do Google, lançou quatro novos modelos de linguagem de grande porte (LLMs) “abertos”. Esses modelos abordam um desafio fundamental: aprender a raciocinar de forma mais eficaz ao longo do tempo e se tornar mais capaz de forma autônoma.

Conhecidos coletivamente como a família Cogito v2, esses modelos variam de 70 bilhões a 671 bilhões de parâmetros. Eles estão disponíveis para desenvolvedores e empresas de IA sob uma combinação de licenças permissivas e totalmente abertas. O lançamento inclui:

Cogito v2-70B (Dense)
Cogito v2-109B (Mistura de especialistas)
Cogito v2-405B (Dense)
Cogito v2-671B (MoE)

Os modelos Dense e MoE têm finalidades distintas. As variantes densas (70B e 405B) ativam todos os parâmetros para cada entrada, tornando-os previsíveis e mais fáceis de implementar em diversas configurações de hardware.

Elas são ideais para tarefas de baixa latência, ajuste fino e ambientes com capacidade limitada de GPU. Em contrapartida, os modelos MoE (109B e 671B) usam um mecanismo de roteamento esparso, ativando apenas um subconjunto de sub-redes “especializadas” por consulta. Esse design suporta tamanhos de modelo totais muito maiores sem aumentar proporcionalmente os custos computacionais.

Assim, os modelos MoE se destacam em inferências de alto desempenho e pesquisas de raciocínio complexo, oferecendo precisão de alto nível com menor custo de tempo de execução. Na linha Cogito v2, o modelo MoE 671B é o carro-chefe, usando sua escala e roteamento eficiente para igualar ou superar os principais modelos abertos em benchmarks — muitas vezes com cadeias de raciocínio muito mais curtas.

Os modelos agora estão acessíveis via Hugging Face para uso empresarial e Unsloth para implantação local. Para aqueles que não podem hospedar por conta própria, o acesso à API é fornecido pela Together AI, Baseten e RunPod.

Uma versão quantizada FP8 (ponto flutuante de 8 bits) do modelo 671B também está disponível. Ao reduzir a precisão dos parâmetros de 16 bits para 8 bits, essa versão permite uma implantação de hardware mais rápida, barata e acessível, mantendo normalmente 95-99% do desempenho original. No entanto, a precisão pode diminuir ligeiramente em tarefas que exigem alta precisão, como certos problemas matemáticos ou de raciocínio.

Todos os quatro modelos Cogito v2 são sistemas de raciocínio híbridos: eles podem responder instantaneamente ou, quando necessário, refletir internamente antes de responder.

Essa reflexão não é apenas um recurso do tempo de inferência — ela é parte integrante do próprio processo de treinamento.

Os modelos são treinados para internalizar seus caminhos de raciocínio. As etapas que eles seguem para chegar às soluções — seus “pensamentos” internos — são destiladas de volta para os pesos fundamentais do modelo.

Com o tempo, eles aprendem a distinguir linhas de raciocínio produtivas das irrelevantes.

Conforme explicado no blog da Deep Cogito, os pesquisadores desencorajam o modelo a “divagar mais” para encontrar uma resposta. Em vez disso, eles o incentivam a desenvolver uma intuição mais forte para o caminho de raciocínio mais eficiente.

O resultado, afirma a Deep Cogito, é um raciocínio mais rápido e eficiente, levando a amplos ganhos de desempenho, mesmo no modo de operação padrão.

O caminho para a IA com autoaperfeiçoamento

Embora relativamente nova para a comunidade de IA em geral, a Deep Cogito vem desenvolvendo sua tecnologia há mais de um ano.

A empresa saiu do anonimato em abril de 2025 com modelos de código aberto baseados no Llama 3.2 da Meta. Esses modelos iniciais apresentaram resultados promissores, após uma rodada de financiamento inicial de US$ 13 milhões liderada pela Benchmark em novembro de 2024. Eric Vishria, da Benchmark, passou a integrar o conselho da empresa.

Conforme abordado anteriormente pela VentureBeat, os menores modelos Cogito v1 (3B e 8B) superaram consistentemente os modelos Llama 3 comparáveis em vários benchmarks, muitas vezes por margens significativas.

O CEO e cofundador da Deep Cogito, Drishan Arora, ex-engenheiro líder de LLM do Google, descreve a visão da empresa como a construção de modelos que refinam seu raciocínio a cada iteração, semelhante à forma como o AlphaGo melhorou por meio do auto-jogo.

No centro dessa abordagem está a Destilação e Amplificação Iterativa (IDA), um método que substitui os prompts de treinamento estáticos pelas próprias percepções em evolução do modelo.

Compreendendo a intuição da máquina

A versão Cogito v2 amplia drasticamente esse ciclo de autoaperfeiçoamento. A ideia fundamental é simples: o raciocínio deve ser incorporado à inteligência central do modelo, não apenas ativado durante a inferência.

Para isso, a empresa implementou um sistema em que os modelos geram cadeias de raciocínio durante o treinamento e, em seguida, aprendem com seus próprios processos de pensamento intermediários.

Benchmarks internos confirmam melhorias tangíveis. O modelo MoE 671B, carro-chefe da empresa, supera o DeepSeek R1 em tarefas de raciocínio, igualando ou excedendo seu modelo 0528 mais recente, enquanto usa cadeias de raciocínio 60% mais curtas, em média.

Em benchmarks como MMLU, GSM8K e MGSM, o Cogito 671B MoE tem um desempenho competitivo com modelos abertos líderes, como Qwen1.5-72B e DeepSeek v3, aproximando-se do nível de desempenho de modelos fechados como Claude 4 Opus e o3.

As principais conclusões incluem:

No modo de raciocínio, o Cogito 671B MoE igualou o DeepSeek R1 0528 em QA multilíngue e conhecimento geral, e superou-o em estratégia e dedução lógica.
No modo padrão (sem raciocínio), ele superou o DeepSeek v3 0324, demonstrando que a intuição destilada proporciona um aumento de desempenho mesmo sem etapas de raciocínio estendidas.
Concluir o raciocínio em menos etapas traz benefícios práticos: custos de inferência mais baixos e tempos de resposta mais rápidos para consultas complexas.

Arora compara isso à diferença entre procurar um destino e já ter uma forte noção de onde ele se encontra.

“Como os modelos Cogito desenvolvem uma intuição melhor para a trajetória de pesquisa correta durante a inferência, suas cadeias de raciocínio são 60% mais curtas do que as do DeepSeek R1”, explicou ele em uma postagem no X.

Onde os modelos do Deep Cogito se destacam: intuição da máquina em ação

Exemplos de testes internos do Cogito v2 ilustram essa capacidade. Em um problema matemático, um usuário pergunta se um trem viajando a 80 mph pode percorrer 240 milhas em menos de 2,5 horas.

Enquanto muitos modelos realizam cálculos detalhados, passo a passo, e podem cometer erros, o Cogito 671B completa uma breve reflexão interna, calcula 240 ÷ 80 = 3 horas e conclui corretamente que o trem não pode chegar a tempo. Ele usa menos de 100 tokens internos, em comparação com os mais de 200 usados pelo DeepSeek R1 para a mesma resposta.

Em um exemplo de raciocínio jurídico sobre a aplicabilidade de uma decisão da Suprema Corte dos Estados Unidos, o modo de raciocínio do Cogito aplica uma lógica clara em duas etapas: primeiro, determinar se o caso hipotético corresponde ao precedente e, em seguida, justificar sua conclusão. Esse raciocínio interpretativo e cheio de nuances continua sendo um desafio para muitos LLMs.

Os modelos também mostram um melhor tratamento da ambiguidade. Em perguntas com várias etapas, como determinar relações familiares (por exemplo, “Alice é mãe de Bob, Bob é pai de Charlie. O que Alice é para Charlie?”), os modelos Cogito v2 identificam corretamente “avó”, mesmo quando a formulação é sutilmente alterada — um ponto em que outros modelos abertos frequentemente tropeçam.

Alcançando eficiência em escala

Notavelmente, a Deep Cogito relata ter treinado todos os seus oito modelos Cogito (incluindo a série v1) por um custo total inferior a US$ 3,5 milhões — uma fração dos orçamentos de nove dígitos relatados para alguns modelos de ponta.

Esse orçamento cobriu a geração extensiva de dados, reforço sintético, infraestrutura e mais de 1.000 experimentos de treinamento.

Arora atribui essa relação custo-benefício a um princípio fundamental: a construção de modelos mais inteligentes depende de uma melhor compreensão básica (“priores”), e não simplesmente de alimentá-los com mais dados.

Ao ensinar os modelos a evitar caminhos de raciocínio redundantes ou enganosos, o Cogito v2 oferece um desempenho robusto sem aumentar o tempo ou o custo de inferência — uma vantagem crítica para serviços baseados em API ou implantação de dispositivos de ponta, onde a latência e as despesas são considerações fundamentais.

Olhando para o futuro: o roteiro da Deep Cogito

O Cogito v2 representa uma etapa iterativa, não um produto final. Arora descreve a abordagem da empresa como “escalada”: executar modelos, aprender com seu raciocínio, destilar essas lições e repetir o ciclo. Cada lançamento de modelo se baseia em seu antecessor.

A Deep Cogito continua comprometida com o código aberto para todos os seus modelos, atuais e futuros. Seu trabalho já conquistou o apoio de investidores como Eric Vishria, da Benchmark, e Aditya Agarwal, da South Park Commons.

Os parceiros de infraestrutura incluem Hugging Face, Together AI, RunPod, Baseten, a equipe Llama da Meta e Unsloth.

Para desenvolvedores, pesquisadores e empresas, os modelos estão disponíveis hoje para uso local, comparação multimodal e ajuste fino específico para cada domínio.

Para a comunidade de IA de código aberto, o Cogito v2 oferece mais do que um marco de referência. Ele apresenta um novo paradigma para a construção da inteligência: um paradigma focado não em pensar mais, mas em aprender a pensar melhor.

Artigo relacionado

Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá

Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire

A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg O Grupo Haier apresentou o robô exoesqueleto com inteligência artificial mais leve do mundo para esportes — o Haier Exoskeleton Robot W3. Este lançamento estabelece um novo recorde do setor em termos

Recomendações de tópicos especiais relacionados

Criação de quadrinhos

Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas

xix.ai

Negócios

Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas

xix.ai

Negócios

As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas

xix.ai

Produtividade

Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas

xix.ai

chatbot

Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas

xix.ai

Educação e Aprendizagem

Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas

xix.ai

Comentários (2)

0/500

Por favor, faça o login primeiro

JamesCarter

3 de Maio de 2026 à6 15:01:06 WEST

Interesting approach, but 'open-ish' sounds like a marketing gimmick. If the weights aren't fully open, how can the community truly verify their 'self-improving' claims? Feels like another startup trying to have its cake and eat it too. The intuition part is fascinating, though. 🤔

WillieJones

8 de Abril de 2026 à50 17:00:50 WEST

¿Modelos auto-mejorables? Parece prometedor, pero siempre me pregunto: ¿cómo verifican que la intuición emergente no genere sesgos peligrosos o alucinaciones más sofisticadas? 🤔 Sería bueno ver más transparencia en los datos de entrenamiento.

Principais notícias

AI Builder e Power Automate Revolucionam a Sumarização de Documentos Hosts de IA do podcast Notebooklm agora disponíveis para entrevistas China revela padrão nacional para robôs humanóides e inteligência incorporada Platôs de adoção de IA corporativa, revelam dados da Ramp Tutorial do Criador de Imagens do Bing: Guia de Geração de Arte por IA Aprenda a criar música de IA usando sua voz: um tutorial passo a passo do SUNO iMyFone MagicMic: Revisão e Tutorial de Mudança de Voz AI em Tempo Real Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como uma revolução na IA multimodal A Embodied Intelligence divulga a primeira norma do setor para conter o crescimento descontrolado

Mais

Apresentou