Maison
Deep Cogito dévoile des modèles d'IA hybrides dotés de capacités de raisonnement avancées
Deep Cogito, un nouvel innovateur en matière d'IA, a lancé une série de modèles d'IA librement accessibles qui passent de manière transparente d'un mode de raisonnement à un mode de non-raisonnement.
Les modèles de raisonnement, tels que o1 d'OpenAI, excellent dans des domaines tels que les mathématiques et la physique en vérifiant méthodiquement les solutions étape par étape. Toutefois, cette précision exige davantage de ressources informatiques et de temps. Pour y remédier, des entreprises comme Anthropic développent des architectures hybrides qui associent le raisonnement à des composants standard, ce qui permet de répondre rapidement à des requêtes simples et d'effectuer des analyses plus approfondies pour les requêtes complexes.
Les modèles de Deep Cogito, baptisés Cogito 1, sont tous des modèles hybrides. L'entreprise affirme qu'ils surpassent les meilleurs modèles ouverts de taille similaire, y compris ceux de Meta et DeepSeek.
"Chaque modèle peut répondre instantanément ou réfléchir avant de répondre, imitant ainsi les modèles de raisonnement", a déclaré Deep Cogito dans un billet de blog. "Ils ont été conçus par une équipe compacte en seulement 75 jours.
Les modèles de Cogito 1 vont de 3 milliards à 70 milliards de paramètres, avec des plans pour des modèles allant jusqu'à 671 milliards de paramètres dans un futur proche. Un plus grand nombre de paramètres améliore généralement les capacités de résolution de problèmes d'un modèle.
Cogito 1 s'appuie sur les modèles Llama de Meta et Qwen d'Alibaba, Deep Cogito appliquant des techniques d'entraînement innovantes pour améliorer les performances et permettre un raisonnement commutable.
Des tests internes montrent que le plus grand modèle, Cogito 70B, avec le raisonnement activé, surpasse le R1 de DeepSeek dans certaines tâches mathématiques et linguistiques. Sans raisonnement, il surpasse également le Llama 4 Scout de Meta sur LiveBench, une vaste évaluation de l'IA.
Tous les modèles de Cogito 1 sont disponibles en téléchargement ou accessibles via des API sur les plateformes Fireworks AI et Together AI.

Performances de Cogito 1 comparées à celles d'autres modèles d'IA populaires disponibles en libre accèsImage Credits:Deep Cogito "Nous n'en sommes qu'au début de notre parcours de mise à l'échelle, et nous n'utilisons qu'une fraction du calcul généralement alloué à l'entraînement de grands modèles de langage", a indiqué Deep Cogito sur son blog. "Nous explorons de nouvelles méthodes de post-entraînement pour l'auto-amélioration".
Fondée en juin 2024 à San Francisco, Deep Cogito a été créée par Drishan Arora, un ancien ingénieur logiciel senior de Google, et Dhruv Malhotra, précédemment chef de produit chez DeepMind, où il s'est concentré sur la recherche générative.
Soutenue par South Park Commons, selon PitchBook, Deep Cogito vise à créer une "superintelligence générale", c'est-à-dire une IA qui surpasse la plupart des humains et qui offre des capacités sans précédent.
Article connexe
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
La nouvelle Roewe i6 arrive sur le marché au prix de 659 000 yuans, équipée d'un processeur Snapdragon 8155 et du modèle Doubao Large
SAIC Roewe a lancé aujourd'hui la nouvelle Roewe i6, une berline compacte qui reprend intégralement le langage stylistique de la Roewe D7. Sa grande calandre verticale caractéristique et sa barre lumi
Recommandations de sujets spéciaux liés
commentaires (0)
Deep Cogito, un nouvel innovateur en matière d'IA, a lancé une série de modèles d'IA librement accessibles qui passent de manière transparente d'un mode de raisonnement à un mode de non-raisonnement.
Les modèles de raisonnement, tels que o1 d'OpenAI, excellent dans des domaines tels que les mathématiques et la physique en vérifiant méthodiquement les solutions étape par étape. Toutefois, cette précision exige davantage de ressources informatiques et de temps. Pour y remédier, des entreprises comme Anthropic développent des architectures hybrides qui associent le raisonnement à des composants standard, ce qui permet de répondre rapidement à des requêtes simples et d'effectuer des analyses plus approfondies pour les requêtes complexes.
Les modèles de Deep Cogito, baptisés Cogito 1, sont tous des modèles hybrides. L'entreprise affirme qu'ils surpassent les meilleurs modèles ouverts de taille similaire, y compris ceux de Meta et DeepSeek.
"Chaque modèle peut répondre instantanément ou réfléchir avant de répondre, imitant ainsi les modèles de raisonnement", a déclaré Deep Cogito dans un billet de blog. "Ils ont été conçus par une équipe compacte en seulement 75 jours.
Les modèles de Cogito 1 vont de 3 milliards à 70 milliards de paramètres, avec des plans pour des modèles allant jusqu'à 671 milliards de paramètres dans un futur proche. Un plus grand nombre de paramètres améliore généralement les capacités de résolution de problèmes d'un modèle.
Cogito 1 s'appuie sur les modèles Llama de Meta et Qwen d'Alibaba, Deep Cogito appliquant des techniques d'entraînement innovantes pour améliorer les performances et permettre un raisonnement commutable.
Des tests internes montrent que le plus grand modèle, Cogito 70B, avec le raisonnement activé, surpasse le R1 de DeepSeek dans certaines tâches mathématiques et linguistiques. Sans raisonnement, il surpasse également le Llama 4 Scout de Meta sur LiveBench, une vaste évaluation de l'IA.
Tous les modèles de Cogito 1 sont disponibles en téléchargement ou accessibles via des API sur les plateformes Fireworks AI et Together AI.

"Nous n'en sommes qu'au début de notre parcours de mise à l'échelle, et nous n'utilisons qu'une fraction du calcul généralement alloué à l'entraînement de grands modèles de langage", a indiqué Deep Cogito sur son blog. "Nous explorons de nouvelles méthodes de post-entraînement pour l'auto-amélioration".
Fondée en juin 2024 à San Francisco, Deep Cogito a été créée par Drishan Arora, un ancien ingénieur logiciel senior de Google, et Dhruv Malhotra, précédemment chef de produit chez DeepMind, où il s'est concentré sur la recherche générative.
Soutenue par South Park Commons, selon PitchBook, Deep Cogito vise à créer une "superintelligence générale", c'est-à-dire une IA qui surpasse la plupart des humains et qui offre des capacités sans précédent.
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
La nouvelle Roewe i6 arrive sur le marché au prix de 659 000 yuans, équipée d'un processeur Snapdragon 8155 et du modèle Doubao Large
SAIC Roewe a lancé aujourd'hui la nouvelle Roewe i6, une berline compacte qui reprend intégralement le langage stylistique de la Roewe D7. Sa grande calandre verticale caractéristique et sa barre lumi











