opção
Lar Notícias Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

Data de lançamento Data de lançamento 6 de Junho de 2025
visualizações visualizações 2

Deep Cogito lança modelos de IA de código aberto e já lidera as paradas

Emergência de Cogito Profundo com Modelos de IA Revolucionários

Em um movimento inovador, Cogito Profundo, uma startup de pesquisa de IA de ponta localizada em São Francisco, lançou oficialmente sua primeira linha de modelos de linguagem grande de código aberto (LLMs), denominados Cogito v1. Esses modelos, ajustados a partir do Llama 3.2 da Meta, apresentam capacidades híbridas de raciocínio que permitem respostas rápidas ou reflexões introspectivas—uma característica semelhante à série “o” da OpenAI e ao R1 da DeepSeek.

Cogito Profundo vislumbra empurrar a IA além das limitações tradicionais de supervisão humana, promovendo melhorias iterativas autônomas em seus modelos. Seu objetivo final? Desenvolver superinteligência—IA que supere a capacidade humana em todos os campos. No entanto, a empresa garante que todos os modelos permanecerão de código aberto.

Drishan Arora, CEO e co-fundador de Cogito Profundo, anteriormente atuou como Engenheiro de Software Sênior na Google, liderando o desenvolvimento de modelos de linguagem grande para o produto de busca gerativa da Google. Ele afirmou confiantemente no X que esses modelos são entre os mais fortes modelos abertos em sua escala, superando concorrentes como LLaMA, DeepSeek e Qwen.

Linhas de Modelos

A oferta inicial inclui cinco tamanhos básicos—3 bilhões, 8 bilhões, 14 bilhões, 32 bilhões e 70 bilhões de parâmetros—e já está disponível nas plataformas Hugging Face, Ollama e APIs via Fireworks e Together AI. Esses modelos operam sob os termos da licença Llama, permitindo uso comercial para até 700 milhões de usuários mensais antes de exigir uma licença paga da Meta.

Cogito Profundo pretende lançar modelos ainda maiores, potencialmente alcançando 671 bilhões de parâmetros, no futuro próximo.

Abordagem de Treinamento: Iterated Distillation and Amplification (IDA)

Arora introduziu o IDA, um método inovador distinto do aprendizado por reforço tradicional a partir de feedback humano (RLHF) ou distilação de modelo professor. O IDA foca em alocar recursos computacionais adicionais para gerar soluções superiores, subsequentemente incorporando esse raciocínio aprimorado no próprio modelo—a um ciclo contínuo de feedback voltado para aumentar suas capacidades. Essa abordagem reflete a estratégia de autojogo do Google AlphaGo adaptada para processamento de linguagem natural.

Benchmark e Avaliações

Cogito Profundo apresentou resultados abrangentes de avaliação comparando os modelos Cogito contra contrapartes de código aberto em áreas como conhecimento geral, raciocínio matemático e tarefas multilíngues. Principais achados incluem:

  • Cogito 3B (Padrão): Superou o LLaMA 3.2 3B no MMLU em 6,7 pontos percentuais (65,4% vs. 58,7%) e no Hellaswag em 18,8 pontos (81,1% vs. 62,3%).
  • Cogito 3B (Modo de Raciocínio): Marcou 72,6% no MMLU e 84,2% no ARC.
  • Cogito 8B (Padrão): Alcançou 80,5% no MMLU, superando o LLaMA 3.1 8B em 12,8 pontos.
  • Cogito 8B (Modo de Raciocínio): Marcou 83,1% no MMLU e 92,0% no ARC.
  • Cogito 70B (Padrão): Liderou o LLaMA 3.3 70B no MMLU em 6,4 pontos (91,7% vs. 85,3%) e superou o LLaMA 4 Scout 109B nos benchmarks agregados (54,5% vs. 53,3%).

Embora os modelos Cogito sejam excepcionais no modo de raciocínio, existem algumas compensações, especialmente em tarefas matemáticas.

Chamada Nativa de Ferramentas

Cogito Profundo também avaliou o desempenho nativo de chamada de ferramentas de seus modelos, um aspecto crucial para sistemas integrados a agentes e APIs.

  • Cogito 3B: Suporta quatro tarefas de chamada de ferramentas e se destaca em chamadas simples e múltiplas de ferramentas.
  • Cogito 8B: Demonstra um desempenho forte em todos os tipos de chamada de ferramentas, superando significativamente o LLaMA 3.1 8B.

Planos Futuros

Olhando para frente, Cogito Profundo planeja introduzir modelos maiores, incluindo variantes mixture-of-experts de 109B, 400B e 671B parâmetros, junto com atualizações contínuas aos checkpoints existentes. A empresa vê o IDA como um caminho sustentável rumo a uma melhoria autônoma escalável, reduzindo a dependência de modelos humanos ou estáticos de professores.

Arora destacou que a utilidade e adaptabilidade no mundo real são os verdadeiros indicadores de sucesso, enfatizando que esta é apenas o início de uma jornada promissora. Cogito Profundo colabora com entidades renomadas como Hugging Face, RunPod, Fireworks AI, Together AI e Ollama, garantindo que todos os modelos permaneçam de código aberto e facilmente acessíveis.

Artigo relacionado
Фонд будущего ИИ Google, возможно, должен действовать осторожно Фонд будущего ИИ Google, возможно, должен действовать осторожно Инвестиционная инициатива Google в области ИИ: стратегический поворот на фоне регуляторного вниманияОбъявление Google о создании фонда AI Futures Fund является смелым шагом в стрем
Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее Внутри скачка ИИ Google: Gemini 2.5 думает глубже, говорит умнее и кодирует быстрее Google приближается к своей цели создания универсального ассистента на основе ИИНа мероприятии Google I/O этого года компания представила значительные обновления серии Gemini 2.5,
Oura добавляет трекинг уровня глюкозы и журнал питания на основе ИИ Oura добавляет трекинг уровня глюкозы и журнал питания на основе ИИ Oura укрепляет своё обязательство в области метаболического здоровья двумя захватывающими новыми функциями.Oura повышает ставки в мире метаболического здоровья с двумя передовыми,
Comentários (0)
0/200
De volta ao topo
OR