opción
Hogar Noticias Deep Cogito's LLMS superan modelos de tamaño similar con IDA

Deep Cogito's LLMS superan modelos de tamaño similar con IDA

Fecha de lanzamiento Fecha de lanzamiento 18 de abril de 2025
Autor Autor JoseAdams
vistas vistas 91

Deep Cogito, una empresa con sede en San Francisco, está haciendo olas en la comunidad de IA con su último lanzamiento de Open Language Models (LLMS). Estos modelos, que vienen en varios tamaños que van desde 3 mil millones a 70 mil millones de parámetros, no son solo otro conjunto de herramientas de IA; Son un paso audaz hacia lo que la compañía llama "superinteligencia general". Deep Cogito afirma que cada uno de sus modelos supera a los principales modelos abiertos de tamaños similares, incluidos los de Llama, Deepseek y Qwen, en la mayoría de los puntos de referencia estándar. Es una gran afirmación, pero lo que es aún más impresionante es que su modelo 70B ha superado al modelo LLAMA 4 109B de expertos (MOE) recientemente lanzado.

Destilación y amplificación iterada (IDA)

En el corazón del avance de Deep Cogito hay un nuevo enfoque de entrenamiento que llaman destilación y amplificación iterada (IDA). Este método se describe como "una estrategia de alineación escalable y eficiente para la superinteligencia general utilizando la superación personal iterativa". Está diseñado para superar las limitaciones del entrenamiento tradicional de LLM, donde la inteligencia del modelo a menudo llega a un techo definido por modelos "supervisores" más grandes o curadores humanos.

El proceso de IDA gira en torno a dos pasos clave que se repiten una y otra vez:

  • Amplificación: este paso utiliza más potencia computacional para ayudar al modelo a encontrar mejores soluciones o capacidades, al igual que las técnicas de razonamiento avanzado.
  • Destilación: Aquí, el modelo internaliza estas capacidades mejoradas, refinando sus parámetros.

Deep Cogito argumenta que esto crea un "ciclo de retroalimentación positivo", lo que permite que la inteligencia del modelo crezca más directamente con los recursos computacionales y la eficiencia del proceso de IDA en sí, en lugar de estar limitada por la inteligencia de un supervisor.

La compañía señala éxitos históricos como Alphago, enfatizando que el "razonamiento avanzado y la superación personal iterativa" fueron cruciales. Ida, afirman, trae estos elementos a la capacitación de LLM. También promocionan la eficiencia de IDA, señalando que su equipo, aunque pequeño, logró desarrollar estos modelos en solo 75 días. En comparación con otros métodos como el aprendizaje de refuerzo de la retroalimentación humana (RLHF) o la destilación estándar de modelos más grandes, se dice que IDA ofrece una mejor escalabilidad.

Como prueba, Deep Cogito destaca cómo su modelo 70B supera a Llama 3.3 70B (destilado de un modelo 405B) y Llama 4 Scout 109B (destilado de un modelo de parámetros 2T).

Capacidades y rendimiento de modelos de cogito profundos

Los nuevos modelos Cogito, que se basan en puntos de control de LLAMA y QWEN, están adaptados a la codificación, las llamadas de funciones y las aplicaciones de agente. Una característica destacada es su doble funcionalidad: "Cada modelo puede responder directamente (LLM estándar) o autorreflexión antes de responder (como los modelos de razonamiento)". Esto refleja las capacidades vistas en modelos como Claude 3.5. Sin embargo, Deep Cogito menciona que no se han centrado en cadenas de razonamiento muy largas, priorizando respuestas más rápidas y la eficiencia de destilar cadenas más cortas.

La compañía ha compartido extensos resultados de referencia, comparando sus modelos Cogito con modelos abiertos de última generación equivalentes a tamaño en modos directos y de razonamiento. En una gama de puntos de referencia como MMLU, MMLU-Pro, ARC, GSM8K y Matemáticas, y en diferentes tamaños de modelo (3B, 8B, 14B, 32B, 70B), los modelos Cogito generalmente muestran mejoras significativas de rendimiento. Por ejemplo, el modelo Cogito 70B obtiene un 91.73% en MMLU en modo estándar, una mejora de +6.40% sobre LLAMA 3.3 70B y 91.00% en modo de pensamiento, A +4.40% aumenta sobre Deepseek R1 Distill 70B. Los puntajes de LiveBench también reflejan estas ganancias.

Aquí hay puntos de referencia de modelos 14B para una comparación de tamaño mediano:

Puntos de referencia de modelos 14B

Si bien Deep Cogito reconoce que los puntos de referencia no capturan completamente la utilidad del mundo real, siguen siendo seguros en el rendimiento práctico de sus modelos. Este lanzamiento se considera una vista previa, y la compañía afirma que "todavía están en las primeras etapas de esta curva de escala". Planean lanzar puntos de control mejorados para los tamaños actuales e introducir modelos MOE más grandes (109B, 400B, 671B) en las próximas semanas y meses. Todos los modelos futuros también serán de código abierto.

Artículo relacionado
Microsoft 365 Copilot이 향상된 검색, 이미지 및 노트북 기능으로 재 설계 한 공개 Microsoft 365 Copilot이 향상된 검색, 이미지 및 노트북 기능으로 재 설계 한 공개 Microsoft는 비즈니스 요구를 충족 시키도록 설계된 Microsoft 365 Copilot 앱에 대한 새로운 테이크를 출시하고 일반 Copilot의 소비자 친화적 인 기능과 더 밀접하게 통합되었습니다. 업데이트 된 버전은 AI 기반 검색을 자랑하며 OPE를 활용하는 새로운 '생성'기능을 자랑합니다.
AI 벤치마킹에 대한 논쟁은 Pokémon에 도달했습니다 AI 벤치마킹에 대한 논쟁은 Pokémon에 도달했습니다 사랑하는 포켓몬의 세계조차도 AI 벤치 마크를 둘러싼 드라마에 면역이되지 않습니다. X의 최근 바이러스 성 게시물은 Google의 최신 Gemini 모델이 Classic Pokémon Video Game Trilogy에서 Anthropic의 주요 클로드 모델을 능가했다고 주장하면서 상당히 화제를 불러 일으켰습니다. 포스트에 따르면, Gemini
2025 년 4 월의 상위 10 개 AI 마케팅 도구 2025 년 4 월의 상위 10 개 AI 마케팅 도구 인공 지능 (AI)은 왼쪽과 오른쪽 산업을 흔들고 있으며 마케팅도 예외는 아닙니다. 소규모 신생 기업에서 대기업에 이르기까지 비즈니스는 브랜드 가시성을 높이고 성장을 주도하기 위해 AI 마케팅 도구를 점점 더 많이 전환하고 있습니다. 이러한 도구를 비즈니스에 통합합니다
comentario (20)
0/200
EricKing
EricKing 19 de abril de 2025 22:12:37 GMT

Deep Cogito's LLMs are impressive, but the app could use a better UI. It's a bit clunky to navigate through the different model sizes. Still, the performance is top-notch, especially with the IDA tech. Definitely worth a look if you're into AI and want to see what's possible with large language models! 🤖💡

EricRoberts
EricRoberts 20 de abril de 2025 04:40:17 GMT

ディープコギトのLLMは印象的ですが、アプリのUIがもう少し改善されると良いですね。モデルサイズをナビゲートするのが少しぎこちないです。それでも、パフォーマンスは最高で、特にIDAテクノロジーとの組み合わせが素晴らしいです。AIに興味があるなら、大規模言語モデルの可能性を見る価値がありますよ!🤖💡

RichardThomas
RichardThomas 19 de abril de 2025 03:58:42 GMT

Os LLMs da Deep Cogito são impressionantes, mas o app poderia ter uma UI melhor. É um pouco desajeitado navegar pelos diferentes tamanhos de modelo. Ainda assim, o desempenho é de primeira linha, especialmente com a tecnologia IDA. Vale a pena dar uma olhada se você gosta de IA e quer ver o que é possível com modelos de linguagem grandes! 🤖💡

WillMitchell
WillMitchell 18 de abril de 2025 20:01:50 GMT

Los LLMs de Deep Cogito son impresionantes, pero la app podría tener una mejor UI. Es un poco torpe navegar entre los diferentes tamaños de modelo. Aún así, el rendimiento es de primera, especialmente con la tecnología IDA. Vale la pena echar un vistazo si te interesa la IA y quieres ver lo que es posible con modelos de lenguaje grandes! 🤖💡

GregoryCarter
GregoryCarter 21 de abril de 2025 03:16:16 GMT

LLM от Deep Cogito впечатляют, но приложение могло бы иметь лучший UI. Навигация по разным размерам моделей немного неуклюжая. Тем не менее, производительность на высшем уровне, особенно с технологией IDA. Обязательно стоит посмотреть, если вы интересуетесь ИИ и хотите увидеть, что возможно с большими языковыми моделями! 🤖💡

JackHernández
JackHernández 19 de abril de 2025 00:12:00 GMT

Deep Cogito's LLMs are a game-changer! The performance boost over similar-sized models is impressive. I've been using the 70 billion parameter model for my research, and it's like having a super-smart assistant. Only downside? It's a bit resource-heavy. Still, totally worth it! 🚀

Volver arriba
OR