Anthropic dévoile son modèle d'IA le plus intelligent
Anthropic vient de dévoiler Claude 3.7 Sonnet, marquant les débuts de son premier «modèle de raisonnement hybride». Ce modèle révolutionnaire est conçu pour relever des défis plus complexes et dépasser les itérations plus tôt en ce qui concerne les tâches comme les mathématiques et le codage.
Pour compléter cette progression, Anthropic lance également un "aperçu de recherche limité" de Claude Code, un outil de codage agentique. Alors que Anthropic alimente déjà les solutions de codage AI comme Cursor, Claude Code est commercialisé en tant que partenaire interactif capable de rechercher et de lire du code, de modifier les fichiers, d'écrire et d'exécuter des tests, de pousser le code vers GitHub et d'utiliser des outils de ligne de commande.
Claude 3.7 Sonnet sera accessible à partir de lundi dans l'application Claude et via l'API d'Anthropic, le substratum rocheux d'Amazon et le sommet de Google Cloud. Le prix reste cohérent avec son prédécesseur, 3,5 Sonnet, à 3 $ par million de jetons d'entrée et 15 $ par million de jetons de sortie.
Contrairement aux concurrents tels que OpenAI, qui offrent des modèles de raisonnement distincts, Anthropic met l'accent sur l'intégration des capacités de raisonnement directement dans le modèle lui-même. Comme l'a expliqué Dianne Penn, la recherche de recherche sur les produits d'Anthropic a expliqué au verge : «Nous pensons fondamentalement que le raisonnement est une caractéristique de l'IA plutôt que quelque chose de complètement séparé.» Par exemple, Claude ne devrait pas se battre beaucoup avec des requêtes simples comme "Quelle heure est-il?" Mais excelle à gérer des invites complexes, comme la planification d'un voyage de deux semaines en Italie tout en faisant l'affins de compte dans des conditions météorologiques.
Anthropique
Anthropique
Penn a noté que Claude 3.7 Sonnet montre une amélioration marquée du codage, des finances et des questions juridiques agentiques. Bien que Claude ne prenne pas encore en charge les recherches sur le Web en temps réel - une capacité présente dans d'autres modèles - il possède une date de coupure de connaissances en octobre 2024, ce qui la rend plus actuelle. Les développeurs peuvent influencer le fonctionnement du modèle via sa fonction ScratchPad et spécifier des temps de réponse exacts. "Parfois", a déclaré le vice-président du produit d'Anthropic, Michael Gerstenhaber, "le développeur doit simplement indiquer qu'il ne devrait pas prendre plus de 200 millisecondes pour répondre à cette question", mettant en évidence une décision stratégique de produit.
En interne, le personnel anthropique a utilisé le nouveau modèle pour concevoir des interfaces de site Web frontal, créer des jeux interactifs et s'engager jusqu'à 45 minutes d'activités de codage, telles que la construction de tests de test et les cas de test de raffinage itérativement, selon Penn.

CODE CLAUDE. Anthropique
Penn a mentionné qu'Anthropic évalue les capacités de ses modèles en les faisant naviguer dans un jeu vidéo Pokémon à l'ancienne, cartographiant l'API du modèle à une interface de contrôleur. Alors que Claude 3.5 Sonnet a eu du mal à quitter Pallet Town initialement, Claude 3.7 a battu avec succès plusieurs dirigeants de gym.
Le récent dévoilement d'Elon Musk de Grok-3 la semaine dernière a souligné le rythme rapide de la compétition du modèle d'IA. Pour l'instant, Anthropic s'avance grâce à la performance impressionnante de Claude 3.7 Sonnet. Sa version fait allusion à un avenir où un seul modèle gère chaque tâche, plutôt que de nécessiter des outils spécialisés pour différentes fonctions.
Article connexe
Billionaires Discuss Automating Jobs Away in This Week's AI Update
Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
YouTube’s TV changes include a redesign and more multiview
YouTube Expands Multiview Beyond Sports—Here’s What’s ComingLove the idea of watching multiple streams at once but wish it wasn’t just for March Madness or NFL Sunday Ticket? Good
Google Rejects Offering Publishers More Options to Opt Out of AI Search
Google's Internal Documents Reveal Publisher Control ControversyAccording to a recently disclosed internal document obtained by Bloomberg, Google considered allowing publishers more granular control over how their content is utilized in AI-driven search features. The document, authored by Google Sea
commentaires (0)
0/200
Anthropic vient de dévoiler Claude 3.7 Sonnet, marquant les débuts de son premier «modèle de raisonnement hybride». Ce modèle révolutionnaire est conçu pour relever des défis plus complexes et dépasser les itérations plus tôt en ce qui concerne les tâches comme les mathématiques et le codage.
Pour compléter cette progression, Anthropic lance également un "aperçu de recherche limité" de Claude Code, un outil de codage agentique. Alors que Anthropic alimente déjà les solutions de codage AI comme Cursor, Claude Code est commercialisé en tant que partenaire interactif capable de rechercher et de lire du code, de modifier les fichiers, d'écrire et d'exécuter des tests, de pousser le code vers GitHub et d'utiliser des outils de ligne de commande.
Claude 3.7 Sonnet sera accessible à partir de lundi dans l'application Claude et via l'API d'Anthropic, le substratum rocheux d'Amazon et le sommet de Google Cloud. Le prix reste cohérent avec son prédécesseur, 3,5 Sonnet, à 3 $ par million de jetons d'entrée et 15 $ par million de jetons de sortie.
Contrairement aux concurrents tels que OpenAI, qui offrent des modèles de raisonnement distincts, Anthropic met l'accent sur l'intégration des capacités de raisonnement directement dans le modèle lui-même. Comme l'a expliqué Dianne Penn, la recherche de recherche sur les produits d'Anthropic a expliqué au verge : «Nous pensons fondamentalement que le raisonnement est une caractéristique de l'IA plutôt que quelque chose de complètement séparé.» Par exemple, Claude ne devrait pas se battre beaucoup avec des requêtes simples comme "Quelle heure est-il?" Mais excelle à gérer des invites complexes, comme la planification d'un voyage de deux semaines en Italie tout en faisant l'affins de compte dans des conditions météorologiques.
Anthropique
Anthropique
Penn a noté que Claude 3.7 Sonnet montre une amélioration marquée du codage, des finances et des questions juridiques agentiques. Bien que Claude ne prenne pas encore en charge les recherches sur le Web en temps réel - une capacité présente dans d'autres modèles - il possède une date de coupure de connaissances en octobre 2024, ce qui la rend plus actuelle. Les développeurs peuvent influencer le fonctionnement du modèle via sa fonction ScratchPad et spécifier des temps de réponse exacts. "Parfois", a déclaré le vice-président du produit d'Anthropic, Michael Gerstenhaber, "le développeur doit simplement indiquer qu'il ne devrait pas prendre plus de 200 millisecondes pour répondre à cette question", mettant en évidence une décision stratégique de produit.
En interne, le personnel anthropique a utilisé le nouveau modèle pour concevoir des interfaces de site Web frontal, créer des jeux interactifs et s'engager jusqu'à 45 minutes d'activités de codage, telles que la construction de tests de test et les cas de test de raffinage itérativement, selon Penn.
CODE CLAUDE. Anthropique
Penn a mentionné qu'Anthropic évalue les capacités de ses modèles en les faisant naviguer dans un jeu vidéo Pokémon à l'ancienne, cartographiant l'API du modèle à une interface de contrôleur. Alors que Claude 3.5 Sonnet a eu du mal à quitter Pallet Town initialement, Claude 3.7 a battu avec succès plusieurs dirigeants de gym.
Le récent dévoilement d'Elon Musk de Grok-3 la semaine dernière a souligné le rythme rapide de la compétition du modèle d'IA. Pour l'instant, Anthropic s'avance grâce à la performance impressionnante de Claude 3.7 Sonnet. Sa version fait allusion à un avenir où un seul modèle gère chaque tâche, plutôt que de nécessiter des outils spécialisés pour différentes fonctions.












