Deep CogitoのLLMSは、IDAを使用して同様のサイズのモデルよりも優れています
サンフランシスコに拠点を置く会社であるディープコギトは、Open Large Language Models(LLMS)の最新リリースでAIコミュニティで波を作っています。これらのモデルは、30億から700億のパラメーターの範囲のさまざまなサイズで提供され、AIツールの単なるセットではありません。彼らは、会社が「一般的な緊張」と呼ぶものへの大胆な一歩です。 Deep Cogitoは、それぞれのモデルが、ほとんどの標準ベンチマークにわたって、Llama、Deepseek、Qwenを含む同様のサイズの主要なオープンモデルよりも優れていると主張しています。それはかなりの主張ですが、さらに印象的なのは、彼らの70Bモデルが最近リリースされたLlama 4 109B混合物(MOE)モデルを超えていると伝えられています。
繰り返し蒸留と増幅(IDA)
Deep Cogitoのブレークスルーの中心にあるのは、彼らが反復蒸留と増幅(IDA)と呼ぶ新しいトレーニングアプローチです。この方法は、「反復的な自己改善を使用した一般的な緊急事態のためのスケーラブルで効率的なアライメント戦略」として説明されています。従来のLLMトレーニングの制限を超えてプッシュするように設計されています。モデルのインテリジェンスは、より大きな「監督」モデルまたは人間のキュレーターによって定義された天井にヒットすることがよくあります。
IDAプロセスは、何度も繰り返される2つの重要なステップを中心に展開します。
- 増幅:このステップでは、より多くの計算能力を使用して、高度な推論技術と同様に、モデルがより良いソリューションや機能を考案するのに役立ちます。
- 蒸留:ここで、モデルはこれらの改善された機能を内部化し、パラメーターを改善します。
Deep Cogitoは、これにより「肯定的なフィードバックループ」が作成され、モデルのインテリジェンスが計算リソースとIDAプロセス自体の効率により、監督のインテリジェンスによって制限されるのではなく、より直接的に成長できると主張しています。
同社は、Alphagoのような歴史的な成功を指摘し、「高度な推論と反復的自己改善」が非常に重要であることを強調しています。彼らは、これらの要素をLLMトレーニングに持ち込むと主張しています。彼らはまた、IDAの効率性を宣伝しており、彼らのチームは小規模ではあるが、約75日でこれらのモデルを開発することができたと指摘しています。人間のフィードバック(RLHF)からの強化学習や、より大きなモデルからの標準蒸留などの他の方法と比較すると、IDAはより良いスケーラビリティを提供すると言われています。
証明として、Deep Cogitoは、70BモデルがLlama 3.3 70B(405Bモデルから蒸留)とLlama 4 Scout 109B(2Tパラメーターモデルから蒸留)の両方を上回る方法を強調しています。
ディープコギトモデルの機能とパフォーマンス
LlamaおよびQwenのチェックポイントに基づいて構築される新しいCogitoモデルは、コーディング、機能呼び出し、およびエージェントアプリケーションに合わせて調整されています。傑出した機能は、それらの二重機能です。「各モデルは直接回答(標準LLM)、または回答する前(推論モデルのように)自己反映できます。」これは、Claude 3.5などのモデルに見られる機能を反映しています。しかし、深いコギトは、彼らが非常に長い推論チェーンに焦点を合わせておらず、より速い答えと短いチェーンを蒸留する効率に優先順位を付けることに言及していると述べています。
同社は、直接モードと推論モードの両方で、Cogitoモデルをサイズに相当する最先端のオープンモデルと比較して、広範なベンチマーク結果を共有しています。 MMLU、MMLU-PRO、ARC、GSM8K、MATHなどのさまざまなベンチマークと、さまざまなモデルサイズ(3B、8B、14B、32B、70B)にわたって、Cogitoモデルは一般に有意なパフォーマンスの改善を示します。たとえば、Cogito 70Bモデルは、標準モードでMMLUで91.73%、Llama 3.3 70bで +6.40%改善、思考モードで91.00%、DeepSeek R1蒸留70bの +4.40%のブースト。ライブベンチスコアもこれらの利益を反映しています。
中規模の比較のための14Bモデルのベンチマークは次のとおりです。

Deep Cogitoは、ベンチマークが実際のユーティリティを完全にキャプチャしないことを認めていますが、モデルの実際のパフォーマンスに自信を持っています。このリリースはプレビューと見なされ、会社は「まだこのスケーリング曲線の初期段階にある」と述べています。彼らは、現在のサイズの改善されたチェックポイントをリリースし、今後数週間および数ヶ月でより大きなMOEモデル(109b、400b、671b)を導入する予定です。すべての将来のモデルもオープンソースになります。
関連記事
AI가 역사적 언어를 모방하는 데 어려움을 겪는다
미국과 캐나다의 연구팀은 ChatGPT와 같은 대형 언어 모델이 광범위하고 비용이 많이 드는 사전 훈련 없이 역사적 관용구를 정확히 재현하는 데 어려움을 겪는다는 것을 발견했다. 이 문제는 AI를 사용해 찰스 디킨스의 미완성 마지막 소설을 완성하는 것과 같은 야심찬 프로젝트를 학술 및 엔터테인먼트 분야에서 실현하기 어렵게 만든다.연구팀은 역사적으로 정확한
억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다
안녕하세요, TechCrunch의 AI 뉴스레터에 다시 오신 것을 환영합니다! 아직 구독하지 않으셨다면, 매주 수요일마다 받은 편지함으로 바로 배달받을 수 있도록 여기를 클릭해 구독하세요.지난주에는 잠시 쉬었지만, 그럴만한 이유가 있었습니다—중국의 AI 회사 DeepSeek의 갑작스러운 급부상 덕분에 AI 뉴스 사이클이 뜨거웠습니다. 정신없는 시간이였지만,
NotebookLM 앱 출시: AI 기반 지식 도구
NotebookLM 모바일 출시: 이제 Android와 iOS에서 만나는 AI 연구 보조 도구NotebookLM에 대한 여러분의 뜨거운 반응에 깊이 감사드립니다. 수백만 사용자가 복잡한 정보를 이해하는 필수 도구로 NotebookLM을 선택해주셨습니다. 하지만 가장 많이 받은 요청은 바로 "언제 모바일에서 사용할 수 있나
コメント (25)
0/200
EricKing
2025年4月20日 0:00:00 GMT
Deep Cogito's LLMs are impressive, but the app could use a better UI. It's a bit clunky to navigate through the different model sizes. Still, the performance is top-notch, especially with the IDA tech. Definitely worth a look if you're into AI and want to see what's possible with large language models! 🤖💡
0
EricRoberts
2025年4月20日 0:00:00 GMT
ディープコギトのLLMは印象的ですが、アプリのUIがもう少し改善されると良いですね。モデルサイズをナビゲートするのが少しぎこちないです。それでも、パフォーマンスは最高で、特にIDAテクノロジーとの組み合わせが素晴らしいです。AIに興味があるなら、大規模言語モデルの可能性を見る価値がありますよ!🤖💡
0
RichardThomas
2025年4月19日 0:00:00 GMT
Os LLMs da Deep Cogito são impressionantes, mas o app poderia ter uma UI melhor. É um pouco desajeitado navegar pelos diferentes tamanhos de modelo. Ainda assim, o desempenho é de primeira linha, especialmente com a tecnologia IDA. Vale a pena dar uma olhada se você gosta de IA e quer ver o que é possível com modelos de linguagem grandes! 🤖💡
0
WillMitchell
2025年4月19日 0:00:00 GMT
Los LLMs de Deep Cogito son impresionantes, pero la app podría tener una mejor UI. Es un poco torpe navegar entre los diferentes tamaños de modelo. Aún así, el rendimiento es de primera, especialmente con la tecnología IDA. Vale la pena echar un vistazo si te interesa la IA y quieres ver lo que es posible con modelos de lenguaje grandes! 🤖💡
0
GregoryCarter
2025年4月21日 0:00:00 GMT
LLM от Deep Cogito впечатляют, но приложение могло бы иметь лучший UI. Навигация по разным размерам моделей немного неуклюжая. Тем не менее, производительность на высшем уровне, особенно с технологией IDA. Обязательно стоит посмотреть, если вы интересуетесь ИИ и хотите увидеть, что возможно с большими языковыми моделями! 🤖💡
0
JackHernández
2025年4月19日 0:00:00 GMT
Deep Cogito's LLMs are a game-changer! The performance boost over similar-sized models is impressive. I've been using the 70 billion parameter model for my research, and it's like having a super-smart assistant. Only downside? It's a bit resource-heavy. Still, totally worth it! 🚀
0
サンフランシスコに拠点を置く会社であるディープコギトは、Open Large Language Models(LLMS)の最新リリースでAIコミュニティで波を作っています。これらのモデルは、30億から700億のパラメーターの範囲のさまざまなサイズで提供され、AIツールの単なるセットではありません。彼らは、会社が「一般的な緊張」と呼ぶものへの大胆な一歩です。 Deep Cogitoは、それぞれのモデルが、ほとんどの標準ベンチマークにわたって、Llama、Deepseek、Qwenを含む同様のサイズの主要なオープンモデルよりも優れていると主張しています。それはかなりの主張ですが、さらに印象的なのは、彼らの70Bモデルが最近リリースされたLlama 4 109B混合物(MOE)モデルを超えていると伝えられています。
繰り返し蒸留と増幅(IDA)
Deep Cogitoのブレークスルーの中心にあるのは、彼らが反復蒸留と増幅(IDA)と呼ぶ新しいトレーニングアプローチです。この方法は、「反復的な自己改善を使用した一般的な緊急事態のためのスケーラブルで効率的なアライメント戦略」として説明されています。従来のLLMトレーニングの制限を超えてプッシュするように設計されています。モデルのインテリジェンスは、より大きな「監督」モデルまたは人間のキュレーターによって定義された天井にヒットすることがよくあります。
IDAプロセスは、何度も繰り返される2つの重要なステップを中心に展開します。
- 増幅:このステップでは、より多くの計算能力を使用して、高度な推論技術と同様に、モデルがより良いソリューションや機能を考案するのに役立ちます。
- 蒸留:ここで、モデルはこれらの改善された機能を内部化し、パラメーターを改善します。
Deep Cogitoは、これにより「肯定的なフィードバックループ」が作成され、モデルのインテリジェンスが計算リソースとIDAプロセス自体の効率により、監督のインテリジェンスによって制限されるのではなく、より直接的に成長できると主張しています。
同社は、Alphagoのような歴史的な成功を指摘し、「高度な推論と反復的自己改善」が非常に重要であることを強調しています。彼らは、これらの要素をLLMトレーニングに持ち込むと主張しています。彼らはまた、IDAの効率性を宣伝しており、彼らのチームは小規模ではあるが、約75日でこれらのモデルを開発することができたと指摘しています。人間のフィードバック(RLHF)からの強化学習や、より大きなモデルからの標準蒸留などの他の方法と比較すると、IDAはより良いスケーラビリティを提供すると言われています。
証明として、Deep Cogitoは、70BモデルがLlama 3.3 70B(405Bモデルから蒸留)とLlama 4 Scout 109B(2Tパラメーターモデルから蒸留)の両方を上回る方法を強調しています。
ディープコギトモデルの機能とパフォーマンス
LlamaおよびQwenのチェックポイントに基づいて構築される新しいCogitoモデルは、コーディング、機能呼び出し、およびエージェントアプリケーションに合わせて調整されています。傑出した機能は、それらの二重機能です。「各モデルは直接回答(標準LLM)、または回答する前(推論モデルのように)自己反映できます。」これは、Claude 3.5などのモデルに見られる機能を反映しています。しかし、深いコギトは、彼らが非常に長い推論チェーンに焦点を合わせておらず、より速い答えと短いチェーンを蒸留する効率に優先順位を付けることに言及していると述べています。
同社は、直接モードと推論モードの両方で、Cogitoモデルをサイズに相当する最先端のオープンモデルと比較して、広範なベンチマーク結果を共有しています。 MMLU、MMLU-PRO、ARC、GSM8K、MATHなどのさまざまなベンチマークと、さまざまなモデルサイズ(3B、8B、14B、32B、70B)にわたって、Cogitoモデルは一般に有意なパフォーマンスの改善を示します。たとえば、Cogito 70Bモデルは、標準モードでMMLUで91.73%、Llama 3.3 70bで +6.40%改善、思考モードで91.00%、DeepSeek R1蒸留70bの +4.40%のブースト。ライブベンチスコアもこれらの利益を反映しています。
中規模の比較のための14Bモデルのベンチマークは次のとおりです。
Deep Cogitoは、ベンチマークが実際のユーティリティを完全にキャプチャしないことを認めていますが、モデルの実際のパフォーマンスに自信を持っています。このリリースはプレビューと見なされ、会社は「まだこのスケーリング曲線の初期段階にある」と述べています。彼らは、現在のサイズの改善されたチェックポイントをリリースし、今後数週間および数ヶ月でより大きなMOEモデル(109b、400b、671b)を導入する予定です。すべての将来のモデルもオープンソースになります。




Deep Cogito's LLMs are impressive, but the app could use a better UI. It's a bit clunky to navigate through the different model sizes. Still, the performance is top-notch, especially with the IDA tech. Definitely worth a look if you're into AI and want to see what's possible with large language models! 🤖💡




ディープコギトのLLMは印象的ですが、アプリのUIがもう少し改善されると良いですね。モデルサイズをナビゲートするのが少しぎこちないです。それでも、パフォーマンスは最高で、特にIDAテクノロジーとの組み合わせが素晴らしいです。AIに興味があるなら、大規模言語モデルの可能性を見る価値がありますよ!🤖💡




Os LLMs da Deep Cogito são impressionantes, mas o app poderia ter uma UI melhor. É um pouco desajeitado navegar pelos diferentes tamanhos de modelo. Ainda assim, o desempenho é de primeira linha, especialmente com a tecnologia IDA. Vale a pena dar uma olhada se você gosta de IA e quer ver o que é possível com modelos de linguagem grandes! 🤖💡




Los LLMs de Deep Cogito son impresionantes, pero la app podría tener una mejor UI. Es un poco torpe navegar entre los diferentes tamaños de modelo. Aún así, el rendimiento es de primera, especialmente con la tecnología IDA. Vale la pena echar un vistazo si te interesa la IA y quieres ver lo que es posible con modelos de lenguaje grandes! 🤖💡




LLM от Deep Cogito впечатляют, но приложение могло бы иметь лучший UI. Навигация по разным размерам моделей немного неуклюжая. Тем не менее, производительность на высшем уровне, особенно с технологией IDA. Обязательно стоит посмотреть, если вы интересуетесь ИИ и хотите увидеть, что возможно с большими языковыми моделями! 🤖💡




Deep Cogito's LLMs are a game-changer! The performance boost over similar-sized models is impressive. I've been using the 70 billion parameter model for my research, and it's like having a super-smart assistant. Only downside? It's a bit resource-heavy. Still, totally worth it! 🚀












