opção
Lar
Notícias
Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

6 de Junho de 2025
60

Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

Emergência de Cogito Profundo com Modelos de IA Revolucionários

Em um movimento inovador, Cogito Profundo, uma startup de pesquisa de IA de ponta localizada em São Francisco, lançou oficialmente sua primeira linha de modelos de linguagem grande de código aberto (LLMs), denominados Cogito v1. Esses modelos, ajustados a partir do Llama 3.2 da Meta, apresentam capacidades híbridas de raciocínio que permitem respostas rápidas ou reflexões introspectivas—uma característica semelhante à série “o” da OpenAI e ao R1 da DeepSeek.

Cogito Profundo vislumbra empurrar a IA além das limitações tradicionais de supervisão humana, promovendo melhorias iterativas autônomas em seus modelos. Seu objetivo final? Desenvolver superinteligência—IA que supere a capacidade humana em todos os campos. No entanto, a empresa garante que todos os modelos permanecerão de código aberto.

Drishan Arora, CEO e co-fundador de Cogito Profundo, anteriormente atuou como Engenheiro de Software Sênior na Google, liderando o desenvolvimento de modelos de linguagem grande para o produto de busca gerativa da Google. Ele afirmou confiantemente no X que esses modelos são entre os mais fortes modelos abertos em sua escala, superando concorrentes como LLaMA, DeepSeek e Qwen.

Linhas de Modelos

A oferta inicial inclui cinco tamanhos básicos—3 bilhões, 8 bilhões, 14 bilhões, 32 bilhões e 70 bilhões de parâmetros—e já está disponível nas plataformas Hugging Face, Ollama e APIs via Fireworks e Together AI. Esses modelos operam sob os termos da licença Llama, permitindo uso comercial para até 700 milhões de usuários mensais antes de exigir uma licença paga da Meta.

Cogito Profundo pretende lançar modelos ainda maiores, potencialmente alcançando 671 bilhões de parâmetros, no futuro próximo.

Abordagem de Treinamento: Iterated Distillation and Amplification (IDA)

Arora introduziu o IDA, um método inovador distinto do aprendizado por reforço tradicional a partir de feedback humano (RLHF) ou distilação de modelo professor. O IDA foca em alocar recursos computacionais adicionais para gerar soluções superiores, subsequentemente incorporando esse raciocínio aprimorado no próprio modelo—a um ciclo contínuo de feedback voltado para aumentar suas capacidades. Essa abordagem reflete a estratégia de autojogo do Google AlphaGo adaptada para processamento de linguagem natural.

Benchmark e Avaliações

Cogito Profundo apresentou resultados abrangentes de avaliação comparando os modelos Cogito contra contrapartes de código aberto em áreas como conhecimento geral, raciocínio matemático e tarefas multilíngues. Principais achados incluem:

  • Cogito 3B (Padrão): Superou o LLaMA 3.2 3B no MMLU em 6,7 pontos percentuais (65,4% vs. 58,7%) e no Hellaswag em 18,8 pontos (81,1% vs. 62,3%).
  • Cogito 3B (Modo de Raciocínio): Marcou 72,6% no MMLU e 84,2% no ARC.
  • Cogito 8B (Padrão): Alcançou 80,5% no MMLU, superando o LLaMA 3.1 8B em 12,8 pontos.
  • Cogito 8B (Modo de Raciocínio): Marcou 83,1% no MMLU e 92,0% no ARC.
  • Cogito 70B (Padrão): Liderou o LLaMA 3.3 70B no MMLU em 6,4 pontos (91,7% vs. 85,3%) e superou o LLaMA 4 Scout 109B nos benchmarks agregados (54,5% vs. 53,3%).

Embora os modelos Cogito sejam excepcionais no modo de raciocínio, existem algumas compensações, especialmente em tarefas matemáticas.

Chamada Nativa de Ferramentas

Cogito Profundo também avaliou o desempenho nativo de chamada de ferramentas de seus modelos, um aspecto crucial para sistemas integrados a agentes e APIs.

  • Cogito 3B: Suporta quatro tarefas de chamada de ferramentas e se destaca em chamadas simples e múltiplas de ferramentas.
  • Cogito 8B: Demonstra um desempenho forte em todos os tipos de chamada de ferramentas, superando significativamente o LLaMA 3.1 8B.

Planos Futuros

Olhando para frente, Cogito Profundo planeja introduzir modelos maiores, incluindo variantes mixture-of-experts de 109B, 400B e 671B parâmetros, junto com atualizações contínuas aos checkpoints existentes. A empresa vê o IDA como um caminho sustentável rumo a uma melhoria autônoma escalável, reduzindo a dependência de modelos humanos ou estáticos de professores.

Arora destacou que a utilidade e adaptabilidade no mundo real são os verdadeiros indicadores de sucesso, enfatizando que esta é apenas o início de uma jornada promissora. Cogito Profundo colabora com entidades renomadas como Hugging Face, RunPod, Fireworks AI, Together AI e Ollama, garantindo que todos os modelos permaneçam de código aberto e facilmente acessíveis.

Artigo relacionado
Google Revela Modelos de IA Gemini 2.5 Prontos para Produção para Competir com a OpenAI no Mercado Empresarial Google Revela Modelos de IA Gemini 2.5 Prontos para Produção para Competir com a OpenAI no Mercado Empresarial A Google intensificou sua estratégia de IA na segunda-feira, lançando seus modelos avançados Gemini 2.5 para uso empresarial e introduzindo uma variante econômica para competir em preço e desempenho.A
Meta Aprimora a Segurança de IA com Ferramentas Avançadas do Llama Meta Aprimora a Segurança de IA com Ferramentas Avançadas do Llama A Meta lançou novas ferramentas de segurança do Llama para fortalecer o desenvolvimento de IA e proteger contra ameaças emergentes.Essas ferramentas de segurança do modelo de IA Llama atualizadas são
NotebookLM Apresenta Cadernos Curados de Publicações e Especialistas de Destaque NotebookLM Apresenta Cadernos Curados de Publicações e Especialistas de Destaque O Google está aprimorando sua ferramenta de pesquisa e anotações baseada em IA, NotebookLM, para servir como um hub de conhecimento abrangente. Na segunda-feira, a empresa lançou uma coleção curada de
Comentários (7)
0/200
EricMartin
EricMartin 28 de Julho de 2025 à21 02:20:21 WEST

Wow, Deep Cogito’s models are killing it! Beating the charts right out the gate is wild. Curious how they stack up against Grok in real-world tasks. 🚀

WilliamRamirez
WilliamRamirez 28 de Julho de 2025 à30 02:19:30 WEST

Wow, Deep Cogito’s open-source models are killing it! Fine-tuning Llama 3.2 to top the charts is no small feat. I’m curious how they’ll stack up against the big players in real-world apps. Exciting times for AI! 🚀

BrianWalker
BrianWalker 7 de Junho de 2025 à53 14:03:53 WEST

Wow, Deep Cogito's models are already topping the charts? That's insane! 🤯 I love how open-source AI is advancing so quickly. Can't wait to try these out for some personal projects. Hope they keep up the good work! #AIFuture

WalterWalker
WalterWalker 7 de Junho de 2025 à11 12:30:11 WEST

Deep Cogitoのモデルがもうチャートトップとは...速すぎる!🔥 オープンソースの進化が楽しみです。自分でも試してみたいな~。これからも応援してます! #AI革命

RaymondBaker
RaymondBaker 7 de Junho de 2025 à31 08:25:31 WEST

Deep Cogitos Modelle schon an der Spitze? Wahnsinn! 🤩 Open-Source-IA entwickelt sich rasend schnell. Bin gespannt, was als Nächstes kommt. Weiter so! #KIZukunft

JonathanKing
JonathanKing 7 de Junho de 2025 à30 04:19:30 WEST

¡Increíble que los modelos de Deep Cogito ya estén liderando! 🚀 El código abierto está cambiando el juego en IA. Ojalá puedan mantener este ritmo. ¡A ver qué más nos sorprenderán! #IAForAll

De volta ao topo
OR