Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

Deep Cogito Surge com Modelos de IA Revolucionários
Em um movimento inovador, a Deep Cogito, uma startup de pesquisa em IA de ponta localizada em São Francisco, revelou oficialmente sua primeira linha de modelos de linguagem de grande escala de código aberto, chamados Cogito v1. Esses modelos, ajustados a partir do Llama 3.2 da Meta, possuem capacidades de raciocínio híbrido que permitem respostas rápidas ou engajamento em pensamento introspectivo — uma característica reminiscente da série “o” da OpenAI e do DeepSeek R1.
A Deep Cogito visa impulsionar a IA além das restrições convencionais de supervisão humana, promovendo autoprogressão iterativa em seus modelos. Seu objetivo final? Desenvolver superinteligência — IA que supera as capacidades humanas em todos os campos. No entanto, a empresa garante que todos os modelos permanecerão de código aberto.
Drishan Arora, CEO e cofundador da Deep Cogito, anteriormente atuou como Engenheiro de Software Sênior no Google, liderando o desenvolvimento de LLMs para o produto de busca generativa do Google. Ele afirmou com confiança no X que esses modelos estão entre os mais fortes em sua escala, superando concorrentes como LLaMA, DeepSeek e Qwen.
A Linha de Modelos
A oferta inicial inclui cinco tamanhos básicos — 3 bilhões, 8 bilhões, 14 bilhões, 32 bilhões e 70 bilhões de parâmetros — e já está acessível em plataformas como Hugging Face, Ollama e APIs por meio de Fireworks e Together AI. Esses modelos operam sob os termos de licenciamento do Llama, permitindo uso comercial para até 700 milhões de usuários mensais antes de exigir uma licença paga da Meta.
A Deep Cogito pretende lançar modelos ainda maiores, potencialmente alcançando 671 bilhões de parâmetros, em um futuro próximo.
Abordagem de Treinamento: Destilação e Amplificação Iterada (IDA)
Arora apresentou a IDA, um método inovador distinto do aprendizado por reforço com feedback humano (RLHF) ou destilação de modelos professores. A IDA foca na alocação de recursos computacionais adicionais para gerar soluções superiores, posteriormente incorporando esse raciocínio aprimorado no próprio modelo — um ciclo de feedback contínuo voltado para aumentar as capacidades. Essa abordagem espelha a estratégia de autojogo do Google AlphaGo adaptada para o processamento de linguagem natural.
Benchmarks e Avaliações
A Deep Cogito apresentou resultados de avaliação abrangentes comparando os modelos Cogito com contrapartes de código aberto em áreas como conhecimento geral, raciocínio matemático e tarefas multilíngues. As principais descobertas incluem:
- Cogito 3B (Padrão): Supera o LLaMA 3.2 3B no MMLU por 6,7 pontos percentuais (65,4% vs. 58,7%) e no Hellaswag por 18,8 pontos (81,1% vs. 62,3%).
- Cogito 3B (Modo de Raciocínio): Obtém 72,6% no MMLU e 84,2% no ARC.
- Cogito 8B (Padrão): Alcança 80,5% no MMLU, superando o LLaMA 3.1 8B por 12,8 pontos.
- Cogito 8B (Modo de Raciocínio): Obtém 83,1% no MMLU e 92,0% no ARC.
- Cogito 70B (Padrão): Lidera o LLaMA 3.3 70B no MMLU por 6,4 pontos (91,7% vs. 85,3%) e supera o LLaMA 4 Scout 109B em benchmarks agregados (54,5% vs. 53,3%).
Embora os modelos Cogito se destaquem no modo de raciocínio, existem certas compensações, particularmente em tarefas matemáticas.
Chamada de Ferramenta Nativa
A Deep Cogito também avaliou o desempenho de chamada de ferramenta nativa de seus modelos, um aspecto crucial para sistemas integrados a agentes e APIs.
- Cogito 3B: Suporta quatro tarefas de chamada de ferramenta e se destaca em chamadas de ferramenta simples e múltiplas.
- Cogito 8B: Demonstra forte desempenho em todos os tipos de chamadas de ferramenta, superando significativamente o LLaMA 3.1 8B.
Planos Futuros
Olhando para o futuro, a Deep Cogito planeja introduzir modelos maiores, incluindo variantes de mistura de especialistas em 109B, 400B e 671B parâmetros, ao lado de atualizações contínuas para os checkpoints existentes. A empresa vê a IDA como um caminho sustentável para a autoprogressão escalável, reduzindo a dependência de modelos humanos ou professores estáticos.
Arora destacou que a utilidade e adaptabilidade no mundo real são as medidas definitivas de sucesso, enfatizando que este é apenas o começo de uma jornada promissora. A Deep Cogito colabora com entidades renomadas como Hugging Face, RunPod, Fireworks AI, Together AI e Ollama, garantindo que todos os modelos permaneçam de código aberto e livremente acessíveis.
Artigo relacionado
Trump prioriza o crescimento da IA em detrimento da regulamentação na corrida para superar a China
O governo Trump revelou seu histórico Plano de Ação de IA na quarta-feira, marcando uma ruptura decisiva com as políticas de IA avessas ao risco do governo Biden. O ambicioso projeto prioriza o desenv
YouTube integra a ferramenta de vídeo Veo 3 AI diretamente na plataforma Shorts
YouTube Shorts apresentará o modelo de vídeo Veo 3 AI neste verãoO CEO do YouTube, Neal Mohan, revelou durante sua apresentação no Cannes Lions que a tecnologia de ponta de geração de vídeo Veo 3 AI d
Os principais laboratórios de IA alertam que a humanidade está perdendo o controle sobre a compreensão dos sistemas de IA
Em uma demonstração de união sem precedentes, pesquisadores da OpenAI, Google DeepMind, Anthropic e Meta deixaram de lado as diferenças competitivas para emitir um alerta coletivo sobre o desenvolvime
Comentários (8)
0/200
AlbertGonzalez
9 de Setembro de 2025 à52 17:30:52 WEST
Deep Cogito這麼快就衝上榜單也太強了吧!看來開源模型真的越來越厲害了,不過這樣會不會讓LLM市場更競爭啊?🤔 我還是擔心小公司以後根本玩不起...
0
EricMartin
28 de Julho de 2025 à21 02:20:21 WEST
Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀
0
WilliamRamirez
28 de Julho de 2025 à30 02:19:30 WEST
Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀
0
BrianWalker
7 de Junho de 2025 à53 14:03:53 WEST
Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture
0
WalterWalker
7 de Junho de 2025 à11 12:30:11 WEST
Deep Cogitoのモデルがもうチャートトップとは...速すぎる!🔥 オープンソースの進化が楽しみです。自分でも試してみたいな~。これからも応援してます! #AI革命
0
RaymondBaker
7 de Junho de 2025 à31 08:25:31 WEST
Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft
0
Deep Cogito Surge com Modelos de IA Revolucionários
Em um movimento inovador, a Deep Cogito, uma startup de pesquisa em IA de ponta localizada em São Francisco, revelou oficialmente sua primeira linha de modelos de linguagem de grande escala de código aberto, chamados Cogito v1. Esses modelos, ajustados a partir do Llama 3.2 da Meta, possuem capacidades de raciocínio híbrido que permitem respostas rápidas ou engajamento em pensamento introspectivo — uma característica reminiscente da série “o” da OpenAI e do DeepSeek R1.
A Deep Cogito visa impulsionar a IA além das restrições convencionais de supervisão humana, promovendo autoprogressão iterativa em seus modelos. Seu objetivo final? Desenvolver superinteligência — IA que supera as capacidades humanas em todos os campos. No entanto, a empresa garante que todos os modelos permanecerão de código aberto.
Drishan Arora, CEO e cofundador da Deep Cogito, anteriormente atuou como Engenheiro de Software Sênior no Google, liderando o desenvolvimento de LLMs para o produto de busca generativa do Google. Ele afirmou com confiança no X que esses modelos estão entre os mais fortes em sua escala, superando concorrentes como LLaMA, DeepSeek e Qwen.
A Linha de Modelos
A oferta inicial inclui cinco tamanhos básicos — 3 bilhões, 8 bilhões, 14 bilhões, 32 bilhões e 70 bilhões de parâmetros — e já está acessível em plataformas como Hugging Face, Ollama e APIs por meio de Fireworks e Together AI. Esses modelos operam sob os termos de licenciamento do Llama, permitindo uso comercial para até 700 milhões de usuários mensais antes de exigir uma licença paga da Meta.
A Deep Cogito pretende lançar modelos ainda maiores, potencialmente alcançando 671 bilhões de parâmetros, em um futuro próximo.
Abordagem de Treinamento: Destilação e Amplificação Iterada (IDA)
Arora apresentou a IDA, um método inovador distinto do aprendizado por reforço com feedback humano (RLHF) ou destilação de modelos professores. A IDA foca na alocação de recursos computacionais adicionais para gerar soluções superiores, posteriormente incorporando esse raciocínio aprimorado no próprio modelo — um ciclo de feedback contínuo voltado para aumentar as capacidades. Essa abordagem espelha a estratégia de autojogo do Google AlphaGo adaptada para o processamento de linguagem natural.
Benchmarks e Avaliações
A Deep Cogito apresentou resultados de avaliação abrangentes comparando os modelos Cogito com contrapartes de código aberto em áreas como conhecimento geral, raciocínio matemático e tarefas multilíngues. As principais descobertas incluem:
- Cogito 3B (Padrão): Supera o LLaMA 3.2 3B no MMLU por 6,7 pontos percentuais (65,4% vs. 58,7%) e no Hellaswag por 18,8 pontos (81,1% vs. 62,3%).
- Cogito 3B (Modo de Raciocínio): Obtém 72,6% no MMLU e 84,2% no ARC.
- Cogito 8B (Padrão): Alcança 80,5% no MMLU, superando o LLaMA 3.1 8B por 12,8 pontos.
- Cogito 8B (Modo de Raciocínio): Obtém 83,1% no MMLU e 92,0% no ARC.
- Cogito 70B (Padrão): Lidera o LLaMA 3.3 70B no MMLU por 6,4 pontos (91,7% vs. 85,3%) e supera o LLaMA 4 Scout 109B em benchmarks agregados (54,5% vs. 53,3%).
Embora os modelos Cogito se destaquem no modo de raciocínio, existem certas compensações, particularmente em tarefas matemáticas.
Chamada de Ferramenta Nativa
A Deep Cogito também avaliou o desempenho de chamada de ferramenta nativa de seus modelos, um aspecto crucial para sistemas integrados a agentes e APIs.
- Cogito 3B: Suporta quatro tarefas de chamada de ferramenta e se destaca em chamadas de ferramenta simples e múltiplas.
- Cogito 8B: Demonstra forte desempenho em todos os tipos de chamadas de ferramenta, superando significativamente o LLaMA 3.1 8B.
Planos Futuros
Olhando para o futuro, a Deep Cogito planeja introduzir modelos maiores, incluindo variantes de mistura de especialistas em 109B, 400B e 671B parâmetros, ao lado de atualizações contínuas para os checkpoints existentes. A empresa vê a IDA como um caminho sustentável para a autoprogressão escalável, reduzindo a dependência de modelos humanos ou professores estáticos.
Arora destacou que a utilidade e adaptabilidade no mundo real são as medidas definitivas de sucesso, enfatizando que este é apenas o começo de uma jornada promissora. A Deep Cogito colabora com entidades renomadas como Hugging Face, RunPod, Fireworks AI, Together AI e Ollama, garantindo que todos os modelos permaneçam de código aberto e livremente acessíveis.




Deep Cogito這麼快就衝上榜單也太強了吧!看來開源模型真的越來越厲害了,不過這樣會不會讓LLM市場更競爭啊?🤔 我還是擔心小公司以後根本玩不起...




Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀




Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀




Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture




Deep Cogitoのモデルがもうチャートトップとは...速すぎる!🔥 オープンソースの進化が楽しみです。自分でも試してみたいな~。これからも応援してます! #AI革命




Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft












