옵션
소식 Deep Cogito의 LLMS는 IDA를 사용하여 유사한 크기의 모델보다 우수합니다

Deep Cogito의 LLMS는 IDA를 사용하여 유사한 크기의 모델보다 우수합니다

출시일 출시일 2025년 4월 18일
작가 작가 JoseAdams
보기 보기 90

샌프란시스코에 본사를 둔 Deep Cogito는 AI 커뮤니티에서 최신 Open Lange Language Models (LLM)를 릴리스하여 파도를 만들고 있습니다. 30 억에서 70 억의 매개 변수 범위의 다양한 크기로 제공되는이 모델은 또 다른 AI 도구 세트가 아닙니다. 그들은 회사가 "일반 초 지능"이라고 부르는 대담한 단계입니다. Deep Cogito는 각 모델이 대부분의 표준 벤치 마크에서 Llama, Deepseek 및 Qwen의 모델을 포함하여 유사한 크기의 주요 개방형 모델을 능가한다고 주장합니다. 그것은 꽤 주장이지만, 더욱 인상적인 것은 그들의 70B 모델이 최근에 출시 된 LLAMA 4 109B Mixper-of-Experts (MOE) 모델보다 더 많이 보여준 것으로 알려졌다.

반복 증류 및 증폭 (IDA)

Deep Cogito의 획기적인 핵심은 반복 증류 및 증폭 (IDA)이라고 부르는 새로운 훈련 접근법이 있습니다. 이 방법은 "반복적 인 자기 개선을 사용한 일반적인 초 지능을위한 확장 가능하고 효율적인 정렬 전략"으로 설명됩니다. 이 모델은 전통적인 LLM 교육의 한계를 뛰어 넘어 모델의 지능이 종종 더 큰 "감독자"모델 또는 인간 큐레이터로 정의 된 천장에 부딪칩니다.

IDA 프로세스는 반복해서 반복되는 두 가지 주요 단계를 중심으로 진행됩니다.

  • 증폭 : 이 단계는 더 많은 계산 능력을 사용하여 고급 추론 기술과 마찬가지로 모델이 더 나은 솔루션이나 기능을 제공 할 수 있도록 도와줍니다.
  • 증류 : 여기서, 모델은 이러한 개선 된 기능을 내부화하여 매개 변수를 정제합니다.

Deep Cogito는 이것이 "긍정적 인 피드백 루프"를 생성한다고 주장하며, 이는 전환자의 지능에 의해 제한되지 않고 계산 자원과 IDA 프로세스 자체의 효율성으로 모델의 지능이 더 직접적으로 성장할 수 있다고 주장합니다.

이 회사는 Alphago와 같은 역사적 성공을 지적하며, "고급 추론과 반복적 인 자기 개선"이 중요하다는 점을 강조합니다. 그들은 Ida는 이러한 요소를 LLM 교육에 가져옵니다. 그들은 또한 팀이 작지만 약 75 일 만에 이러한 모델을 개발할 수 있다고 지적하면서 IDA의 효율성을 선전했습니다. 인간 피드백 (RLHF)의 강화 학습 (RLHF) 또는 더 큰 모델의 표준 증류와 같은 다른 방법과 비교할 때 IDA는 더 나은 확장 성을 제공한다고합니다.

증거로서 Deep Cogito는 70B 모델이 LLAMA 3.3 70B (405B 모델에서 증류)와 LLAMA 4 Scout 109B (2T 매개 변수 모델에서 증류)를 능가하는 방법을 강조합니다.

딥 코기 모델의 기능 및 성능

Llama 및 Qwen 체크 포인트를 기반으로하는 새로운 Cogito 모델은 코딩, 기능 호출 및 에이전트 응용 프로그램에 맞게 조정되었습니다. 눈에 띄는 기능은 이중 기능입니다. "각 모델은 직접 답변 (표준 LLM) 또는 답변하기 전에 (추론 모델과 같은) 답변 할 수 있습니다." 이 기능은 Claude 3.5와 같은 모델에서 볼 수 있습니다. 그러나 Deep Cogito는 그들이 긴 추론 체인에 초점을 맞추지 않았으며, 더 빠른 답변과 짧은 체인을 증류하는 효율성을 우선시하지 않았다고 언급했습니다.

이 회사는 직접 및 추론 모드에서 크기와 동등한 최첨단 개방형 모델과 Cogito 모델을 비교하여 광범위한 벤치 마크 결과를 공유했습니다. MMLU, MMLU-PRO, ARC, GSM8K 및 MATH와 같은 다양한 벤치 마크 및 다양한 모델 크기 (3B, 8B, 14B, 32B, 70B)에서 Cogito 모델은 일반적으로 상당한 성능 향상을 보여줍니다. 예를 들어, Cogito 70B 모델은 표준 모드에서 MMLU에서 91.73%, LLAMA 3.3 70B에서 A +6.40% 개선, 사고 모드에서 91.00%, DeepSeek R1 Distill 70B보다 +4.40% 증가했습니다. LiveBench 점수는 이러한 이익도 반영합니다.

다음은 중간 크기 비교를위한 14B 모델의 벤치 마크입니다.

14B 모델의 벤치 마크

Deep Cogito는 벤치 마크가 실제 유틸리티를 완전히 포착하지 못한다는 것을 인정하지만 모델의 실제 성능에 대해 확신을 가지고 있습니다. 이 릴리스는 미리보기로 간주되며 회사는 "여전히이 스케일링 곡선의 초기 단계에 있습니다"라고 말합니다. 그들은 현재 크기에 대한 개선 된 체크 포인트를 출시 할 계획이며 앞으로 몇 주 및 몇 달 안에 더 큰 MOE 모델 (109b, 400b, 671b)을 소개 할 계획입니다. 모든 미래 모델도 오픈 소스가 될 것입니다.

관련 기사
Microsoft 365 Copilot이 향상된 검색, 이미지 및 노트북 기능으로 재 설계 한 공개 Microsoft 365 Copilot이 향상된 검색, 이미지 및 노트북 기능으로 재 설계 한 공개 Microsoft는 비즈니스 요구를 충족 시키도록 설계된 Microsoft 365 Copilot 앱에 대한 새로운 테이크를 출시하고 일반 Copilot의 소비자 친화적 인 기능과 더 밀접하게 통합되었습니다. 업데이트 된 버전은 AI 기반 검색을 자랑하며 OPE를 활용하는 새로운 '생성'기능을 자랑합니다.
AI 벤치마킹에 대한 논쟁은 Pokémon에 도달했습니다 AI 벤치마킹에 대한 논쟁은 Pokémon에 도달했습니다 사랑하는 포켓몬의 세계조차도 AI 벤치 마크를 둘러싼 드라마에 면역이되지 않습니다. X의 최근 바이러스 성 게시물은 Google의 최신 Gemini 모델이 Classic Pokémon Video Game Trilogy에서 Anthropic의 주요 클로드 모델을 능가했다고 주장하면서 상당히 화제를 불러 일으켰습니다. 포스트에 따르면, Gemini
2025 년 4 월의 상위 10 개 AI 마케팅 도구 2025 년 4 월의 상위 10 개 AI 마케팅 도구 인공 지능 (AI)은 왼쪽과 오른쪽 산업을 흔들고 있으며 마케팅도 예외는 아닙니다. 소규모 신생 기업에서 대기업에 이르기까지 비즈니스는 브랜드 가시성을 높이고 성장을 주도하기 위해 AI 마케팅 도구를 점점 더 많이 전환하고 있습니다. 이러한 도구를 비즈니스에 통합합니다
의견 (20)
0/200
EricKing
EricKing 2025년 4월 19일 오후 10시 12분 37초 GMT

Deep Cogito's LLMs are impressive, but the app could use a better UI. It's a bit clunky to navigate through the different model sizes. Still, the performance is top-notch, especially with the IDA tech. Definitely worth a look if you're into AI and want to see what's possible with large language models! 🤖💡

EricRoberts
EricRoberts 2025년 4월 20일 오전 4시 40분 17초 GMT

ディープコギトのLLMは印象的ですが、アプリのUIがもう少し改善されると良いですね。モデルサイズをナビゲートするのが少しぎこちないです。それでも、パフォーマンスは最高で、特にIDAテクノロジーとの組み合わせが素晴らしいです。AIに興味があるなら、大規模言語モデルの可能性を見る価値がありますよ!🤖💡

RichardThomas
RichardThomas 2025년 4월 19일 오전 3시 58분 42초 GMT

Os LLMs da Deep Cogito são impressionantes, mas o app poderia ter uma UI melhor. É um pouco desajeitado navegar pelos diferentes tamanhos de modelo. Ainda assim, o desempenho é de primeira linha, especialmente com a tecnologia IDA. Vale a pena dar uma olhada se você gosta de IA e quer ver o que é possível com modelos de linguagem grandes! 🤖💡

WillMitchell
WillMitchell 2025년 4월 18일 오후 8시 1분 50초 GMT

Los LLMs de Deep Cogito son impresionantes, pero la app podría tener una mejor UI. Es un poco torpe navegar entre los diferentes tamaños de modelo. Aún así, el rendimiento es de primera, especialmente con la tecnología IDA. Vale la pena echar un vistazo si te interesa la IA y quieres ver lo que es posible con modelos de lenguaje grandes! 🤖💡

GregoryCarter
GregoryCarter 2025년 4월 21일 오전 3시 16분 16초 GMT

LLM от Deep Cogito впечатляют, но приложение могло бы иметь лучший UI. Навигация по разным размерам моделей немного неуклюжая. Тем не менее, производительность на высшем уровне, особенно с технологией IDA. Обязательно стоит посмотреть, если вы интересуетесь ИИ и хотите увидеть, что возможно с большими языковыми моделями! 🤖💡

JackHernández
JackHernández 2025년 4월 19일 오전 12시 12분 0초 GMT

Deep Cogito's LLMs are a game-changer! The performance boost over similar-sized models is impressive. I've been using the 70 billion parameter model for my research, and it's like having a super-smart assistant. Only downside? It's a bit resource-heavy. Still, totally worth it! 🚀

위로 돌아갑니다
OR