Anthropic dévoile son modèle d'IA le plus intelligent
Anthropic vient de dévoiler Claude 3.7 Sonnet, marquant le lancement de son premier « modèle de raisonnement hybride ». Ce modèle révolutionnaire est conçu pour relever des défis plus complexes et surpasse les itérations précédentes dans des tâches telles que les mathématiques et le codage.
Pour accompagner cette avancée, Anthropic lance également une « prévisualisation de recherche limitée » de Claude Code, un outil de codage agentique. Bien qu’Anthropic alimente déjà des solutions de codage AI comme Cursor, Claude Code est présenté comme un partenaire interactif capable de rechercher et lire du code, de modifier des fichiers, d’écrire et d’exécuter des tests, de pousser du code sur GitHub et d’utiliser des outils en ligne de commande.
Claude 3.7 Sonnet sera accessible à partir de lundi via l’application Claude et par l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Le prix reste identique à celui de son prédécesseur, 3.5 Sonnet, à 3 $ par million de jetons d’entrée et 15 $ par million de jetons de sortie.
Contrairement à des concurrents comme OpenAI, qui proposent des modèles de raisonnement distincts, Anthropic met l’accent sur l’intégration des capacités de raisonnement directement dans le modèle lui-même. Comme l’a expliqué Dianne Penn, responsable de la recherche produit chez Anthropic, à The Verge, « Nous croyons fondamentalement que le raisonnement est une caractéristique de l’IA plutôt que quelque chose de totalement séparé. » Par exemple, Claude ne devrait pas avoir de mal avec des requêtes simples comme « Quelle heure est-il ? », mais excelle dans la gestion de prompts complexes comme la planification d’un voyage de deux semaines en Italie en tenant compte des conditions météorologiques.
Anthropic
Anthropic
Penn a noté que Claude 3.7 Sonnet montre une amélioration marquée dans le codage agentique, la finance et les questions juridiques. Bien que Claude ne prenne pas encore en charge les recherches web en temps réel — une capacité présente dans d’autres modèles — il bénéficie d’une date limite de connaissances d’octobre 2024, ce qui le rend plus actuel. Les développeurs peuvent influencer le fonctionnement du modèle grâce à sa fonction de bloc-notes et spécifier des temps de réponse précis. « Parfois », a déclaré Michael Gerstenhaber, vice-président produit d’Anthropic, « le développeur doit simplement indiquer que la réponse ne doit pas prendre plus de 200 millisecondes », soulignant une décision stratégique de produit.
En interne, le personnel d’Anthropic a utilisé le nouveau modèle pour concevoir des interfaces de sites web front-end, créer des jeux interactifs et s’engager dans des activités de codage pouvant durer jusqu’à 45 minutes, comme la construction de jeux de tests et l’affinage itératif des cas de test, selon Penn.

Claude Code. Anthropic
Penn a mentionné qu’Anthropic évalue les capacités de ses modèles en les faisant naviguer dans un jeu vidéo Pokémon à l’ancienne, en mappant l’API du modèle sur une interface de contrôleur. Alors que Claude 3.5 Sonnet avait du mal à quitter Pallet Town au départ, Claude 3.7 a réussi à vaincre plusieurs chefs de gymnase.
La récente dévoilation de Grok-3 par Elon Musk la semaine dernière a souligné le rythme rapide de la compétition des modèles AI. Pour l’instant, Anthropic prend l’avantage grâce aux performances impressionnantes de Claude 3.7 Sonnet. Sa sortie laisse entrevoir un avenir où un seul modèle gère toutes les tâches, plutôt que de nécessiter des outils spécialisés pour différentes fonctions.
Article connexe
Notion transforme son espace de travail en une plateforme centralisée pour les agents IA
Notion, l'éditeur de logiciels de productivité, entre dans l'ère des agents.Lors d'une annonce de produit diffusée en direct mercredi, Notion — surtout connu pour son application de pri
ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs
ElevenLabs, la société spécialisée dans l'IA vocale, a révélé le nom d'investisseurs supplémentaires ayant participé à son tour de table de série D de 500 millions de dollars, initialement annoncé en
WordPress.com permet désormais à des agents IA de rédiger et de publier des articles, et bien plus encore
WordPress.com, la célèbre plateforme d'hébergement et de publication Web, se tourne désormais vers les agents IA, une initiative qui pourrait bien redéfinir l'apparence et l'ergonomie du Web. La socié
Recommandations de sujets spéciaux liés
commentaires (4)
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。
Anthropic vient de dévoiler Claude 3.7 Sonnet, marquant le lancement de son premier « modèle de raisonnement hybride ». Ce modèle révolutionnaire est conçu pour relever des défis plus complexes et surpasse les itérations précédentes dans des tâches telles que les mathématiques et le codage.
Pour accompagner cette avancée, Anthropic lance également une « prévisualisation de recherche limitée » de Claude Code, un outil de codage agentique. Bien qu’Anthropic alimente déjà des solutions de codage AI comme Cursor, Claude Code est présenté comme un partenaire interactif capable de rechercher et lire du code, de modifier des fichiers, d’écrire et d’exécuter des tests, de pousser du code sur GitHub et d’utiliser des outils en ligne de commande.
Claude 3.7 Sonnet sera accessible à partir de lundi via l’application Claude et par l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Le prix reste identique à celui de son prédécesseur, 3.5 Sonnet, à 3 $ par million de jetons d’entrée et 15 $ par million de jetons de sortie.
Contrairement à des concurrents comme OpenAI, qui proposent des modèles de raisonnement distincts, Anthropic met l’accent sur l’intégration des capacités de raisonnement directement dans le modèle lui-même. Comme l’a expliqué Dianne Penn, responsable de la recherche produit chez Anthropic, à The Verge, « Nous croyons fondamentalement que le raisonnement est une caractéristique de l’IA plutôt que quelque chose de totalement séparé. » Par exemple, Claude ne devrait pas avoir de mal avec des requêtes simples comme « Quelle heure est-il ? », mais excelle dans la gestion de prompts complexes comme la planification d’un voyage de deux semaines en Italie en tenant compte des conditions météorologiques.
Anthropic
Anthropic
Penn a noté que Claude 3.7 Sonnet montre une amélioration marquée dans le codage agentique, la finance et les questions juridiques. Bien que Claude ne prenne pas encore en charge les recherches web en temps réel — une capacité présente dans d’autres modèles — il bénéficie d’une date limite de connaissances d’octobre 2024, ce qui le rend plus actuel. Les développeurs peuvent influencer le fonctionnement du modèle grâce à sa fonction de bloc-notes et spécifier des temps de réponse précis. « Parfois », a déclaré Michael Gerstenhaber, vice-président produit d’Anthropic, « le développeur doit simplement indiquer que la réponse ne doit pas prendre plus de 200 millisecondes », soulignant une décision stratégique de produit.
En interne, le personnel d’Anthropic a utilisé le nouveau modèle pour concevoir des interfaces de sites web front-end, créer des jeux interactifs et s’engager dans des activités de codage pouvant durer jusqu’à 45 minutes, comme la construction de jeux de tests et l’affinage itératif des cas de test, selon Penn.

Claude Code. Anthropic
Penn a mentionné qu’Anthropic évalue les capacités de ses modèles en les faisant naviguer dans un jeu vidéo Pokémon à l’ancienne, en mappant l’API du modèle sur une interface de contrôleur. Alors que Claude 3.5 Sonnet avait du mal à quitter Pallet Town au départ, Claude 3.7 a réussi à vaincre plusieurs chefs de gymnase.
La récente dévoilation de Grok-3 par Elon Musk la semaine dernière a souligné le rythme rapide de la compétition des modèles AI. Pour l’instant, Anthropic prend l’avantage grâce aux performances impressionnantes de Claude 3.7 Sonnet. Sa sortie laisse entrevoir un avenir où un seul modèle gère toutes les tâches, plutôt que de nécessiter des outils spécialisés pour différentes fonctions.
Notion transforme son espace de travail en une plateforme centralisée pour les agents IA
Notion, l'éditeur de logiciels de productivité, entre dans l'ère des agents.Lors d'une annonce de produit diffusée en direct mercredi, Notion — surtout connu pour son application de pri
ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs
ElevenLabs, la société spécialisée dans l'IA vocale, a révélé le nom d'investisseurs supplémentaires ayant participé à son tour de table de série D de 500 millions de dollars, initialement annoncé en
WordPress.com permet désormais à des agents IA de rédiger et de publier des articles, et bien plus encore
WordPress.com, la célèbre plateforme d'hébergement et de publication Web, se tourne désormais vers les agents IA, une initiative qui pourrait bien redéfinir l'apparence et l'ergonomie du Web. La socié
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。





Maison






