Deep CogitoのLLMSは、IDAを使用して同様のサイズのモデルよりも優れています
2025年4月18日
JoseAdams
90
サンフランシスコに拠点を置く会社であるディープコギトは、Open Large Language Models(LLMS)の最新リリースでAIコミュニティで波を作っています。これらのモデルは、30億から700億のパラメーターの範囲のさまざまなサイズで提供され、AIツールの単なるセットではありません。彼らは、会社が「一般的な緊張」と呼ぶものへの大胆な一歩です。 Deep Cogitoは、それぞれのモデルが、ほとんどの標準ベンチマークにわたって、Llama、Deepseek、Qwenを含む同様のサイズの主要なオープンモデルよりも優れていると主張しています。それはかなりの主張ですが、さらに印象的なのは、彼らの70Bモデルが最近リリースされたLlama 4 109B混合物(MOE)モデルを超えていると伝えられています。
繰り返し蒸留と増幅(IDA)
Deep Cogitoのブレークスルーの中心にあるのは、彼らが反復蒸留と増幅(IDA)と呼ぶ新しいトレーニングアプローチです。この方法は、「反復的な自己改善を使用した一般的な緊急事態のためのスケーラブルで効率的なアライメント戦略」として説明されています。従来のLLMトレーニングの制限を超えてプッシュするように設計されています。モデルのインテリジェンスは、より大きな「監督」モデルまたは人間のキュレーターによって定義された天井にヒットすることがよくあります。
IDAプロセスは、何度も繰り返される2つの重要なステップを中心に展開します。
- 増幅:このステップでは、より多くの計算能力を使用して、高度な推論技術と同様に、モデルがより良いソリューションや機能を考案するのに役立ちます。
- 蒸留:ここで、モデルはこれらの改善された機能を内部化し、パラメーターを改善します。
Deep Cogitoは、これにより「肯定的なフィードバックループ」が作成され、モデルのインテリジェンスが計算リソースとIDAプロセス自体の効率により、監督のインテリジェンスによって制限されるのではなく、より直接的に成長できると主張しています。
同社は、Alphagoのような歴史的な成功を指摘し、「高度な推論と反復的自己改善」が非常に重要であることを強調しています。彼らは、これらの要素をLLMトレーニングに持ち込むと主張しています。彼らはまた、IDAの効率性を宣伝しており、彼らのチームは小規模ではあるが、約75日でこれらのモデルを開発することができたと指摘しています。人間のフィードバック(RLHF)からの強化学習や、より大きなモデルからの標準蒸留などの他の方法と比較すると、IDAはより良いスケーラビリティを提供すると言われています。
証明として、Deep Cogitoは、70BモデルがLlama 3.3 70B(405Bモデルから蒸留)とLlama 4 Scout 109B(2Tパラメーターモデルから蒸留)の両方を上回る方法を強調しています。
ディープコギトモデルの機能とパフォーマンス
LlamaおよびQwenのチェックポイントに基づいて構築される新しいCogitoモデルは、コーディング、機能呼び出し、およびエージェントアプリケーションに合わせて調整されています。傑出した機能は、それらの二重機能です。「各モデルは直接回答(標準LLM)、または回答する前(推論モデルのように)自己反映できます。」これは、Claude 3.5などのモデルに見られる機能を反映しています。しかし、深いコギトは、彼らが非常に長い推論チェーンに焦点を合わせておらず、より速い答えと短いチェーンを蒸留する効率に優先順位を付けることに言及していると述べています。
同社は、直接モードと推論モードの両方で、Cogitoモデルをサイズに相当する最先端のオープンモデルと比較して、広範なベンチマーク結果を共有しています。 MMLU、MMLU-PRO、ARC、GSM8K、MATHなどのさまざまなベンチマークと、さまざまなモデルサイズ(3B、8B、14B、32B、70B)にわたって、Cogitoモデルは一般に有意なパフォーマンスの改善を示します。たとえば、Cogito 70Bモデルは、標準モードでMMLUで91.73%、Llama 3.3 70bで +6.40%改善、思考モードで91.00%、DeepSeek R1蒸留70bの +4.40%のブースト。ライブベンチスコアもこれらの利益を反映しています。
中規模の比較のための14Bモデルのベンチマークは次のとおりです。

Deep Cogitoは、ベンチマークが実際のユーティリティを完全にキャプチャしないことを認めていますが、モデルの実際のパフォーマンスに自信を持っています。このリリースはプレビューと見なされ、会社は「まだこのスケーリング曲線の初期段階にある」と述べています。彼らは、現在のサイズの改善されたチェックポイントをリリースし、今後数週間および数ヶ月でより大きなMOEモデル(109b、400b、671b)を導入する予定です。すべての将来のモデルもオープンソースになります。
関連記事
Microsoft 365 Copilot enthüllt die Redesign mit verbesserten Funktionen für die Suche, Bild und Notebook
Microsoft bereitet sich darauf vor, die Microsoft 365-Copilot-App neu zu sammeln, um den geschäftlichen Anforderungen gerecht zu werden und gleichzeitig enger in die verbraucherfreundlichen Funktionen des regulären Copilots zu integrieren. Die aktualisierte Version bietet eine KI-angetriebene Suche
Debatten über AI -Benchmarking haben Pokémon erreicht
Sogar die geliebte Welt von Pokémon ist nicht immun gegen das Drama, das KI -Benchmarks umgibt. Ein aktueller viraler Beitrag auf X war ein wesentlicher Bestand, und behauptete, dass Googles neuestes Gemini -Modell das führende Claude -Modell von Anthropic in der klassischen Pokémon -Videospiel -Trilogie übertroffen habe. Nach der Post, Gemini
Top 10 KI -Marketing -Tools für April 2025
Künstliche Intelligenz (KI) schüttelt die Branchen links und rechts auf, und Marketing ist keine Ausnahme. Von kleinen Startups bis zu großen Unternehmen wenden sich Unternehmen zunehmend an KI -Marketing -Tools, um ihre Markensichtbarkeit zu steigern und ihr Wachstum voranzutreiben. Einbeziehung dieser Tools in Ihr Unternehmen integrieren
コメント (20)
0/200
EricKing
2025年4月19日 22:12:37 GMT
Deep Cogito's LLMs are impressive, but the app could use a better UI. It's a bit clunky to navigate through the different model sizes. Still, the performance is top-notch, especially with the IDA tech. Definitely worth a look if you're into AI and want to see what's possible with large language models! 🤖💡
0
EricRoberts
2025年4月20日 4:40:17 GMT
ディープコギトのLLMは印象的ですが、アプリのUIがもう少し改善されると良いですね。モデルサイズをナビゲートするのが少しぎこちないです。それでも、パフォーマンスは最高で、特にIDAテクノロジーとの組み合わせが素晴らしいです。AIに興味があるなら、大規模言語モデルの可能性を見る価値がありますよ!🤖💡
0
RichardThomas
2025年4月19日 3:58:42 GMT
Os LLMs da Deep Cogito são impressionantes, mas o app poderia ter uma UI melhor. É um pouco desajeitado navegar pelos diferentes tamanhos de modelo. Ainda assim, o desempenho é de primeira linha, especialmente com a tecnologia IDA. Vale a pena dar uma olhada se você gosta de IA e quer ver o que é possível com modelos de linguagem grandes! 🤖💡
0
WillMitchell
2025年4月18日 20:01:50 GMT
Los LLMs de Deep Cogito son impresionantes, pero la app podría tener una mejor UI. Es un poco torpe navegar entre los diferentes tamaños de modelo. Aún así, el rendimiento es de primera, especialmente con la tecnología IDA. Vale la pena echar un vistazo si te interesa la IA y quieres ver lo que es posible con modelos de lenguaje grandes! 🤖💡
0
GregoryCarter
2025年4月21日 3:16:16 GMT
LLM от Deep Cogito впечатляют, но приложение могло бы иметь лучший UI. Навигация по разным размерам моделей немного неуклюжая. Тем не менее, производительность на высшем уровне, особенно с технологией IDA. Обязательно стоит посмотреть, если вы интересуетесь ИИ и хотите увидеть, что возможно с большими языковыми моделями! 🤖💡
0
JackHernández
2025年4月19日 0:12:00 GMT
Deep Cogito's LLMs are a game-changer! The performance boost over similar-sized models is impressive. I've been using the 70 billion parameter model for my research, and it's like having a super-smart assistant. Only downside? It's a bit resource-heavy. Still, totally worth it! 🚀
0






サンフランシスコに拠点を置く会社であるディープコギトは、Open Large Language Models(LLMS)の最新リリースでAIコミュニティで波を作っています。これらのモデルは、30億から700億のパラメーターの範囲のさまざまなサイズで提供され、AIツールの単なるセットではありません。彼らは、会社が「一般的な緊張」と呼ぶものへの大胆な一歩です。 Deep Cogitoは、それぞれのモデルが、ほとんどの標準ベンチマークにわたって、Llama、Deepseek、Qwenを含む同様のサイズの主要なオープンモデルよりも優れていると主張しています。それはかなりの主張ですが、さらに印象的なのは、彼らの70Bモデルが最近リリースされたLlama 4 109B混合物(MOE)モデルを超えていると伝えられています。
繰り返し蒸留と増幅(IDA)
Deep Cogitoのブレークスルーの中心にあるのは、彼らが反復蒸留と増幅(IDA)と呼ぶ新しいトレーニングアプローチです。この方法は、「反復的な自己改善を使用した一般的な緊急事態のためのスケーラブルで効率的なアライメント戦略」として説明されています。従来のLLMトレーニングの制限を超えてプッシュするように設計されています。モデルのインテリジェンスは、より大きな「監督」モデルまたは人間のキュレーターによって定義された天井にヒットすることがよくあります。
IDAプロセスは、何度も繰り返される2つの重要なステップを中心に展開します。
- 増幅:このステップでは、より多くの計算能力を使用して、高度な推論技術と同様に、モデルがより良いソリューションや機能を考案するのに役立ちます。
- 蒸留:ここで、モデルはこれらの改善された機能を内部化し、パラメーターを改善します。
Deep Cogitoは、これにより「肯定的なフィードバックループ」が作成され、モデルのインテリジェンスが計算リソースとIDAプロセス自体の効率により、監督のインテリジェンスによって制限されるのではなく、より直接的に成長できると主張しています。
同社は、Alphagoのような歴史的な成功を指摘し、「高度な推論と反復的自己改善」が非常に重要であることを強調しています。彼らは、これらの要素をLLMトレーニングに持ち込むと主張しています。彼らはまた、IDAの効率性を宣伝しており、彼らのチームは小規模ではあるが、約75日でこれらのモデルを開発することができたと指摘しています。人間のフィードバック(RLHF)からの強化学習や、より大きなモデルからの標準蒸留などの他の方法と比較すると、IDAはより良いスケーラビリティを提供すると言われています。
証明として、Deep Cogitoは、70BモデルがLlama 3.3 70B(405Bモデルから蒸留)とLlama 4 Scout 109B(2Tパラメーターモデルから蒸留)の両方を上回る方法を強調しています。
ディープコギトモデルの機能とパフォーマンス
LlamaおよびQwenのチェックポイントに基づいて構築される新しいCogitoモデルは、コーディング、機能呼び出し、およびエージェントアプリケーションに合わせて調整されています。傑出した機能は、それらの二重機能です。「各モデルは直接回答(標準LLM)、または回答する前(推論モデルのように)自己反映できます。」これは、Claude 3.5などのモデルに見られる機能を反映しています。しかし、深いコギトは、彼らが非常に長い推論チェーンに焦点を合わせておらず、より速い答えと短いチェーンを蒸留する効率に優先順位を付けることに言及していると述べています。
同社は、直接モードと推論モードの両方で、Cogitoモデルをサイズに相当する最先端のオープンモデルと比較して、広範なベンチマーク結果を共有しています。 MMLU、MMLU-PRO、ARC、GSM8K、MATHなどのさまざまなベンチマークと、さまざまなモデルサイズ(3B、8B、14B、32B、70B)にわたって、Cogitoモデルは一般に有意なパフォーマンスの改善を示します。たとえば、Cogito 70Bモデルは、標準モードでMMLUで91.73%、Llama 3.3 70bで +6.40%改善、思考モードで91.00%、DeepSeek R1蒸留70bの +4.40%のブースト。ライブベンチスコアもこれらの利益を反映しています。
中規模の比較のための14Bモデルのベンチマークは次のとおりです。
Deep Cogitoは、ベンチマークが実際のユーティリティを完全にキャプチャしないことを認めていますが、モデルの実際のパフォーマンスに自信を持っています。このリリースはプレビューと見なされ、会社は「まだこのスケーリング曲線の初期段階にある」と述べています。彼らは、現在のサイズの改善されたチェックポイントをリリースし、今後数週間および数ヶ月でより大きなMOEモデル(109b、400b、671b)を導入する予定です。すべての将来のモデルもオープンソースになります。




Deep Cogito's LLMs are impressive, but the app could use a better UI. It's a bit clunky to navigate through the different model sizes. Still, the performance is top-notch, especially with the IDA tech. Definitely worth a look if you're into AI and want to see what's possible with large language models! 🤖💡




ディープコギトのLLMは印象的ですが、アプリのUIがもう少し改善されると良いですね。モデルサイズをナビゲートするのが少しぎこちないです。それでも、パフォーマンスは最高で、特にIDAテクノロジーとの組み合わせが素晴らしいです。AIに興味があるなら、大規模言語モデルの可能性を見る価値がありますよ!🤖💡




Os LLMs da Deep Cogito são impressionantes, mas o app poderia ter uma UI melhor. É um pouco desajeitado navegar pelos diferentes tamanhos de modelo. Ainda assim, o desempenho é de primeira linha, especialmente com a tecnologia IDA. Vale a pena dar uma olhada se você gosta de IA e quer ver o que é possível com modelos de linguagem grandes! 🤖💡




Los LLMs de Deep Cogito son impresionantes, pero la app podría tener una mejor UI. Es un poco torpe navegar entre los diferentes tamaños de modelo. Aún así, el rendimiento es de primera, especialmente con la tecnología IDA. Vale la pena echar un vistazo si te interesa la IA y quieres ver lo que es posible con modelos de lenguaje grandes! 🤖💡




LLM от Deep Cogito впечатляют, но приложение могло бы иметь лучший UI. Навигация по разным размерам моделей немного неуклюжая. Тем не менее, производительность на высшем уровне, особенно с технологией IDA. Обязательно стоит посмотреть, если вы интересуетесь ИИ и хотите увидеть, что возможно с большими языковыми моделями! 🤖💡




Deep Cogito's LLMs are a game-changer! The performance boost over similar-sized models is impressive. I've been using the 70 billion parameter model for my research, and it's like having a super-smart assistant. Only downside? It's a bit resource-heavy. Still, totally worth it! 🚀












