Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

Deep Cogito Surge com Modelos de IA Revolucionários
Em um movimento inovador, a Deep Cogito, uma startup de pesquisa em IA de ponta localizada em São Francisco, revelou oficialmente sua primeira linha de modelos de linguagem de grande escala de código aberto, chamados Cogito v1. Esses modelos, ajustados a partir do Llama 3.2 da Meta, possuem capacidades de raciocínio híbrido que permitem respostas rápidas ou engajamento em pensamento introspectivo — uma característica reminiscente da série “o” da OpenAI e do DeepSeek R1.
A Deep Cogito visa impulsionar a IA além das restrições convencionais de supervisão humana, promovendo autoprogressão iterativa em seus modelos. Seu objetivo final? Desenvolver superinteligência — IA que supera as capacidades humanas em todos os campos. No entanto, a empresa garante que todos os modelos permanecerão de código aberto.
Drishan Arora, CEO e cofundador da Deep Cogito, anteriormente atuou como Engenheiro de Software Sênior no Google, liderando o desenvolvimento de LLMs para o produto de busca generativa do Google. Ele afirmou com confiança no X que esses modelos estão entre os mais fortes em sua escala, superando concorrentes como LLaMA, DeepSeek e Qwen.
A Linha de Modelos
A oferta inicial inclui cinco tamanhos básicos — 3 bilhões, 8 bilhões, 14 bilhões, 32 bilhões e 70 bilhões de parâmetros — e já está acessível em plataformas como Hugging Face, Ollama e APIs por meio de Fireworks e Together AI. Esses modelos operam sob os termos de licenciamento do Llama, permitindo uso comercial para até 700 milhões de usuários mensais antes de exigir uma licença paga da Meta.
A Deep Cogito pretende lançar modelos ainda maiores, potencialmente alcançando 671 bilhões de parâmetros, em um futuro próximo.
Abordagem de Treinamento: Destilação e Amplificação Iterada (IDA)
Arora apresentou a IDA, um método inovador distinto do aprendizado por reforço com feedback humano (RLHF) ou destilação de modelos professores. A IDA foca na alocação de recursos computacionais adicionais para gerar soluções superiores, posteriormente incorporando esse raciocínio aprimorado no próprio modelo — um ciclo de feedback contínuo voltado para aumentar as capacidades. Essa abordagem espelha a estratégia de autojogo do Google AlphaGo adaptada para o processamento de linguagem natural.
Benchmarks e Avaliações
A Deep Cogito apresentou resultados de avaliação abrangentes comparando os modelos Cogito com contrapartes de código aberto em áreas como conhecimento geral, raciocínio matemático e tarefas multilíngues. As principais descobertas incluem:
- Cogito 3B (Padrão): Supera o LLaMA 3.2 3B no MMLU por 6,7 pontos percentuais (65,4% vs. 58,7%) e no Hellaswag por 18,8 pontos (81,1% vs. 62,3%).
- Cogito 3B (Modo de Raciocínio): Obtém 72,6% no MMLU e 84,2% no ARC.
- Cogito 8B (Padrão): Alcança 80,5% no MMLU, superando o LLaMA 3.1 8B por 12,8 pontos.
- Cogito 8B (Modo de Raciocínio): Obtém 83,1% no MMLU e 92,0% no ARC.
- Cogito 70B (Padrão): Lidera o LLaMA 3.3 70B no MMLU por 6,4 pontos (91,7% vs. 85,3%) e supera o LLaMA 4 Scout 109B em benchmarks agregados (54,5% vs. 53,3%).
Embora os modelos Cogito se destaquem no modo de raciocínio, existem certas compensações, particularmente em tarefas matemáticas.
Chamada de Ferramenta Nativa
A Deep Cogito também avaliou o desempenho de chamada de ferramenta nativa de seus modelos, um aspecto crucial para sistemas integrados a agentes e APIs.
- Cogito 3B: Suporta quatro tarefas de chamada de ferramenta e se destaca em chamadas de ferramenta simples e múltiplas.
- Cogito 8B: Demonstra forte desempenho em todos os tipos de chamadas de ferramenta, superando significativamente o LLaMA 3.1 8B.
Planos Futuros
Olhando para o futuro, a Deep Cogito planeja introduzir modelos maiores, incluindo variantes de mistura de especialistas em 109B, 400B e 671B parâmetros, ao lado de atualizações contínuas para os checkpoints existentes. A empresa vê a IDA como um caminho sustentável para a autoprogressão escalável, reduzindo a dependência de modelos humanos ou professores estáticos.
Arora destacou que a utilidade e adaptabilidade no mundo real são as medidas definitivas de sucesso, enfatizando que este é apenas o começo de uma jornada promissora. A Deep Cogito colabora com entidades renomadas como Hugging Face, RunPod, Fireworks AI, Together AI e Ollama, garantindo que todos os modelos permaneçam de código aberto e livremente acessíveis.
Artigo relacionado
A Notion transforma seu espaço de trabalho em um centro para agentes de IA
A Notion, empresa de software de produtividade, está entrando na era dos agentes.Durante um anúncio de produto transmitido ao vivo na quarta-feira, a Notion — mais conhecida por seu aplicativo colabor
A ElevenLabs anuncia a BlackRock, Jamie Foxx e Eva Longoria como novos investidores
A ElevenLabs, empresa especializada em IA de voz, revelou novos investidores em sua rodada de financiamento da Série D, no valor de US$ 500 milhões, anunciada originalmente em fevereiro. Entre eles es
O Google IO 2026 apresenta a interação por voz com a caixa de entrada do Gmail
O Google continua a integrar a IA à sua caixa de entrada. Na conferência de desenvolvedores IO 2026, realizada na terça-feira, a empresa ampliou o recurso “AI Inbox” do Gmail com IA conversacional, pe
Recomendações de tópicos especiais relacionados
Comentários (10)
Wait, another open-source player topping charts overnight? 🤔 I'll admit the numbers look impressive on paper, but seeing a startup immediately "top the charts" feels a bit... marketing-heavy. Is this sustainable innovation or just great fine-tuning of existing bedrock like Llama 3.2? The field is getting crowded, and I genuinely wonder how many of these new models will actually be around in two years. Still, competition is good for us users! Excited to test it myself and see if it lives up to the hype.
Interesting to see another player in the open-source AI field! I have mixed feelings—skeptical about 'revolutionary' claims from new startups, even with impressive initial benchmarks. Hope they can really deliver real-world applications beyond just chart performance. This space is getting crowded 🌱
Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀
Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀

Deep Cogito Surge com Modelos de IA Revolucionários
Em um movimento inovador, a Deep Cogito, uma startup de pesquisa em IA de ponta localizada em São Francisco, revelou oficialmente sua primeira linha de modelos de linguagem de grande escala de código aberto, chamados Cogito v1. Esses modelos, ajustados a partir do Llama 3.2 da Meta, possuem capacidades de raciocínio híbrido que permitem respostas rápidas ou engajamento em pensamento introspectivo — uma característica reminiscente da série “o” da OpenAI e do DeepSeek R1.
A Deep Cogito visa impulsionar a IA além das restrições convencionais de supervisão humana, promovendo autoprogressão iterativa em seus modelos. Seu objetivo final? Desenvolver superinteligência — IA que supera as capacidades humanas em todos os campos. No entanto, a empresa garante que todos os modelos permanecerão de código aberto.
Drishan Arora, CEO e cofundador da Deep Cogito, anteriormente atuou como Engenheiro de Software Sênior no Google, liderando o desenvolvimento de LLMs para o produto de busca generativa do Google. Ele afirmou com confiança no X que esses modelos estão entre os mais fortes em sua escala, superando concorrentes como LLaMA, DeepSeek e Qwen.
A Linha de Modelos
A oferta inicial inclui cinco tamanhos básicos — 3 bilhões, 8 bilhões, 14 bilhões, 32 bilhões e 70 bilhões de parâmetros — e já está acessível em plataformas como Hugging Face, Ollama e APIs por meio de Fireworks e Together AI. Esses modelos operam sob os termos de licenciamento do Llama, permitindo uso comercial para até 700 milhões de usuários mensais antes de exigir uma licença paga da Meta.
A Deep Cogito pretende lançar modelos ainda maiores, potencialmente alcançando 671 bilhões de parâmetros, em um futuro próximo.
Abordagem de Treinamento: Destilação e Amplificação Iterada (IDA)
Arora apresentou a IDA, um método inovador distinto do aprendizado por reforço com feedback humano (RLHF) ou destilação de modelos professores. A IDA foca na alocação de recursos computacionais adicionais para gerar soluções superiores, posteriormente incorporando esse raciocínio aprimorado no próprio modelo — um ciclo de feedback contínuo voltado para aumentar as capacidades. Essa abordagem espelha a estratégia de autojogo do Google AlphaGo adaptada para o processamento de linguagem natural.
Benchmarks e Avaliações
A Deep Cogito apresentou resultados de avaliação abrangentes comparando os modelos Cogito com contrapartes de código aberto em áreas como conhecimento geral, raciocínio matemático e tarefas multilíngues. As principais descobertas incluem:
- Cogito 3B (Padrão): Supera o LLaMA 3.2 3B no MMLU por 6,7 pontos percentuais (65,4% vs. 58,7%) e no Hellaswag por 18,8 pontos (81,1% vs. 62,3%).
- Cogito 3B (Modo de Raciocínio): Obtém 72,6% no MMLU e 84,2% no ARC.
- Cogito 8B (Padrão): Alcança 80,5% no MMLU, superando o LLaMA 3.1 8B por 12,8 pontos.
- Cogito 8B (Modo de Raciocínio): Obtém 83,1% no MMLU e 92,0% no ARC.
- Cogito 70B (Padrão): Lidera o LLaMA 3.3 70B no MMLU por 6,4 pontos (91,7% vs. 85,3%) e supera o LLaMA 4 Scout 109B em benchmarks agregados (54,5% vs. 53,3%).
Embora os modelos Cogito se destaquem no modo de raciocínio, existem certas compensações, particularmente em tarefas matemáticas.
Chamada de Ferramenta Nativa
A Deep Cogito também avaliou o desempenho de chamada de ferramenta nativa de seus modelos, um aspecto crucial para sistemas integrados a agentes e APIs.
- Cogito 3B: Suporta quatro tarefas de chamada de ferramenta e se destaca em chamadas de ferramenta simples e múltiplas.
- Cogito 8B: Demonstra forte desempenho em todos os tipos de chamadas de ferramenta, superando significativamente o LLaMA 3.1 8B.
Planos Futuros
Olhando para o futuro, a Deep Cogito planeja introduzir modelos maiores, incluindo variantes de mistura de especialistas em 109B, 400B e 671B parâmetros, ao lado de atualizações contínuas para os checkpoints existentes. A empresa vê a IDA como um caminho sustentável para a autoprogressão escalável, reduzindo a dependência de modelos humanos ou professores estáticos.
Arora destacou que a utilidade e adaptabilidade no mundo real são as medidas definitivas de sucesso, enfatizando que este é apenas o começo de uma jornada promissora. A Deep Cogito colabora com entidades renomadas como Hugging Face, RunPod, Fireworks AI, Together AI e Ollama, garantindo que todos os modelos permaneçam de código aberto e livremente acessíveis.
A Notion transforma seu espaço de trabalho em um centro para agentes de IA
A Notion, empresa de software de produtividade, está entrando na era dos agentes.Durante um anúncio de produto transmitido ao vivo na quarta-feira, a Notion — mais conhecida por seu aplicativo colabor
A ElevenLabs anuncia a BlackRock, Jamie Foxx e Eva Longoria como novos investidores
A ElevenLabs, empresa especializada em IA de voz, revelou novos investidores em sua rodada de financiamento da Série D, no valor de US$ 500 milhões, anunciada originalmente em fevereiro. Entre eles es
O Google IO 2026 apresenta a interação por voz com a caixa de entrada do Gmail
O Google continua a integrar a IA à sua caixa de entrada. Na conferência de desenvolvedores IO 2026, realizada na terça-feira, a empresa ampliou o recurso “AI Inbox” do Gmail com IA conversacional, pe
Wait, another open-source player topping charts overnight? 🤔 I'll admit the numbers look impressive on paper, but seeing a startup immediately "top the charts" feels a bit... marketing-heavy. Is this sustainable innovation or just great fine-tuning of existing bedrock like Llama 3.2? The field is getting crowded, and I genuinely wonder how many of these new models will actually be around in two years. Still, competition is good for us users! Excited to test it myself and see if it lives up to the hype.
Interesting to see another player in the open-source AI field! I have mixed feelings—skeptical about 'revolutionary' claims from new startups, even with impressive initial benchmarks. Hope they can really deliver real-world applications beyond just chart performance. This space is getting crowded 🌱
Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀
Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀





Lar






