Maison
Anthropic dévoile un outil de conseil en IA proposant des rôles de modèles spécialisés
Anthropic a officiellement lancé l'outil Advisor au sein de l'API de la plateforme Claude, proposant ainsi aux développeurs un nouveau modèle d'intelligence hybride. Dans cette configuration, un modèle plus abordable et plus rapide prend en charge l'essentiel de la charge de travail, ne faisant appel automatiquement au modèle le plus puissant pour obtenir des conseils stratégiques que lorsque des décisions complexes doivent être prises. Cette conception repense en profondeur l'approche traditionnelle du développement d'agents, qui consiste à « faire planifier par un grand modèle et agir par un petit modèle », offrant ainsi une solution véritablement optimale en termes de rapport coût-performance.
Mécanisme innovant : le petit modèle exécute, le grand modèle conseille
Cette nouvelle fonctionnalité positionne Claude Sonnet ou Haiku comme « exécutant », chargé d’appeler les outils, de traiter les tâches et d’intégrer les résultats. L’exécutant ne transmet le contexte actuel à Claude Opus pour obtenir des conseils que lorsqu’il rencontre un problème difficile qu’il ne peut résoudre seul.
Opus fournit des solutions de haut niveau, des corrections de cap ou des conseils stratégiques avant de rendre immédiatement le contrôle à l’exécuteur. Élément crucial, Opus n’appelle pas directement les outils et ne fournit pas de résultats finaux aux utilisateurs, agissant plutôt comme un « stratège » invisible. Cette conception inversée garantit que la majeure partie de la consommation de jetons se fait sur le modèle moins coûteux, réservant la puissance de calcul haut de gamme aux moments critiques.

Performances et coûts : une situation gagnant-gagnant pour les tests
Les données de test officielles révèlent des avantages significatifs :
La combinaison Sonnet + Opus Advisor a affiché une amélioration de 2,7 points de pourcentage sur le benchmark multilingue SWE-bench par rapport à Sonnet seul, tandis que le coût global par tâche a diminué de 11,9 %.
Le duo Haiku + Opus Advisor a livré des résultats encore plus impressionnants. Son score au test BrowseComp a bondi de 19,7 % à 41,2 %, doublant ainsi ses performances. Bien qu’il reste encore environ 29 % en deçà des performances de Sonnet seul, son coût ne représente que 15 % de celui de Sonnet, ce qui le rend idéal pour les scénarios de traitement par lots à forte concurrence avec une tolérance aux erreurs plus élevée.
Ces résultats démontrent qu'en acheminant intelligemment les décisions clés, les développeurs peuvent dépasser le choix difficile entre « Opus est trop coûteux pour une utilisation à plein temps » et « Sonnet seul n'est pas assez puissant ».
Simple à utiliser : activation en une seule ligne de configuration
Les développeurs peuvent activer cette fonctionnalité simplement en ajoutant une définition d'outil de type advisor_20260301 au tableau tools de l'API Messages. Les opérations complexes telles que le changement de modèle et le passage de contexte sont gérées automatiquement au sein d'une seule requête API, éliminant ainsi la nécessité d'orchestrer manuellement plusieurs appels ou de gérer un contexte supplémentaire.
Le paramètre max_uses permet de contrôler de manière flexible le nombre maximal de consultations de l'advisor par requête. En matière de facturation, l'utilisation des jetons pour l'exécuteur et l'advisor est facturée séparément, garantissant ainsi transparence et contrôle. Actuellement en version bêta, l'utilisation de cette fonctionnalité nécessite d'ajouter `anthropic-beta: advisor-tool-2026-03-01` à l'en-tête de la requête.
Impact sur le secteur : ouvrir de nouvelles perspectives pour le développement rentable d'agents
Le lancement de l'Advisor Tool marque une évolution importante dans les paradigmes de développement des agents IA. Il permet aux développeurs de bénéficier de l'efficacité d'exécution de Sonnet et d'une tarification proche de celle de Sonnet pour environ 95 % des tâches, tout en bénéficiant d'un jugement de niveau Opus pour les 5 % de points de décision critiques. Cette stratégie hybride « exécuteur + conseiller » réduit non seulement le coût des déploiements à grande échelle, mais améliore aussi considérablement la viabilité des modèles plus petits dans des flux de travail complexes.
Qu'il s'agisse de créer des agents de codage, des outils d'automatisation de navigateur ou des systèmes de traitement de données à haut débit, l'Advisor Tool offre une option efficace, flexible et économique. Anthropic prouve une fois de plus que les avancées en matière de capacités des modèles ne découlent pas uniquement de l'échelle des paramètres, mais aussi de l'innovation en matière d'architecture et de modèles d'utilisation.
Alors que la phase bêta se poursuit, cette fonctionnalité est en passe de devenir rapidement un outil standard pour les développeurs qui créent des agents IA performants et économes. Ses mises à jour ultérieures et ses performances de référence méritent certainement d'être suivies de près.
Article connexe
Baidu Health teste en interne son assistant médical basé sur l'IA, DoctorClaw, pour la recherche documentaire et l'assistance administrative à court terme
Baidu Health aurait commencé à tester en interne un assistant intelligent basé sur l'IA, destiné aux médecins. Baptisé en interne « DoctorClaw » (la version « Lobster Doctor »), ce produit marque
Cursor Composer 2 contre Claude Opus 4.6 : un test de performance relance le débat sur la programmation par IA
Le 19 mars, Cursor a officiellement lancé son modèle de codage développé en interne, Composer 2. Cette annonce a immédiatement suscité des discussions au sein de la communauté des développeurs : selon
StrictlyVC San Francisco réunira des dirigeants de TDK Ventures, Replit et d'autres entreprises
Le premier événement StrictlyVC de l'année arrive à San Francisco plus tôt que vous ne le pensez. Il reste encore des billets pour notre rencontre du 30 avril au Sentro Filipino Cultural Center,
Recommandations de sujets spéciaux liés
commentaires (0)
Anthropic a officiellement lancé l'outil Advisor au sein de l'API de la plateforme Claude, proposant ainsi aux développeurs un nouveau modèle d'intelligence hybride. Dans cette configuration, un modèle plus abordable et plus rapide prend en charge l'essentiel de la charge de travail, ne faisant appel automatiquement au modèle le plus puissant pour obtenir des conseils stratégiques que lorsque des décisions complexes doivent être prises. Cette conception repense en profondeur l'approche traditionnelle du développement d'agents, qui consiste à « faire planifier par un grand modèle et agir par un petit modèle », offrant ainsi une solution véritablement optimale en termes de rapport coût-performance.
Mécanisme innovant : le petit modèle exécute, le grand modèle conseille
Cette nouvelle fonctionnalité positionne Claude Sonnet ou Haiku comme « exécutant », chargé d’appeler les outils, de traiter les tâches et d’intégrer les résultats. L’exécutant ne transmet le contexte actuel à Claude Opus pour obtenir des conseils que lorsqu’il rencontre un problème difficile qu’il ne peut résoudre seul.
Opus fournit des solutions de haut niveau, des corrections de cap ou des conseils stratégiques avant de rendre immédiatement le contrôle à l’exécuteur. Élément crucial, Opus n’appelle pas directement les outils et ne fournit pas de résultats finaux aux utilisateurs, agissant plutôt comme un « stratège » invisible. Cette conception inversée garantit que la majeure partie de la consommation de jetons se fait sur le modèle moins coûteux, réservant la puissance de calcul haut de gamme aux moments critiques.

Performances et coûts : une situation gagnant-gagnant pour les tests
Les données de test officielles révèlent des avantages significatifs :
La combinaison Sonnet + Opus Advisor a affiché une amélioration de 2,7 points de pourcentage sur le benchmark multilingue SWE-bench par rapport à Sonnet seul, tandis que le coût global par tâche a diminué de 11,9 %.
Le duo Haiku + Opus Advisor a livré des résultats encore plus impressionnants. Son score au test BrowseComp a bondi de 19,7 % à 41,2 %, doublant ainsi ses performances. Bien qu’il reste encore environ 29 % en deçà des performances de Sonnet seul, son coût ne représente que 15 % de celui de Sonnet, ce qui le rend idéal pour les scénarios de traitement par lots à forte concurrence avec une tolérance aux erreurs plus élevée.
Ces résultats démontrent qu'en acheminant intelligemment les décisions clés, les développeurs peuvent dépasser le choix difficile entre « Opus est trop coûteux pour une utilisation à plein temps » et « Sonnet seul n'est pas assez puissant ».
Simple à utiliser : activation en une seule ligne de configuration
Les développeurs peuvent activer cette fonctionnalité simplement en ajoutant une définition d'outil de type advisor_20260301 au tableau tools de l'API Messages. Les opérations complexes telles que le changement de modèle et le passage de contexte sont gérées automatiquement au sein d'une seule requête API, éliminant ainsi la nécessité d'orchestrer manuellement plusieurs appels ou de gérer un contexte supplémentaire.
Le paramètre max_uses permet de contrôler de manière flexible le nombre maximal de consultations de l'advisor par requête. En matière de facturation, l'utilisation des jetons pour l'exécuteur et l'advisor est facturée séparément, garantissant ainsi transparence et contrôle. Actuellement en version bêta, l'utilisation de cette fonctionnalité nécessite d'ajouter `anthropic-beta: advisor-tool-2026-03-01` à l'en-tête de la requête.
Impact sur le secteur : ouvrir de nouvelles perspectives pour le développement rentable d'agents
Le lancement de l'Advisor Tool marque une évolution importante dans les paradigmes de développement des agents IA. Il permet aux développeurs de bénéficier de l'efficacité d'exécution de Sonnet et d'une tarification proche de celle de Sonnet pour environ 95 % des tâches, tout en bénéficiant d'un jugement de niveau Opus pour les 5 % de points de décision critiques. Cette stratégie hybride « exécuteur + conseiller » réduit non seulement le coût des déploiements à grande échelle, mais améliore aussi considérablement la viabilité des modèles plus petits dans des flux de travail complexes.
Qu'il s'agisse de créer des agents de codage, des outils d'automatisation de navigateur ou des systèmes de traitement de données à haut débit, l'Advisor Tool offre une option efficace, flexible et économique. Anthropic prouve une fois de plus que les avancées en matière de capacités des modèles ne découlent pas uniquement de l'échelle des paramètres, mais aussi de l'innovation en matière d'architecture et de modèles d'utilisation.
Alors que la phase bêta se poursuit, cette fonctionnalité est en passe de devenir rapidement un outil standard pour les développeurs qui créent des agents IA performants et économes. Ses mises à jour ultérieures et ses performances de référence méritent certainement d'être suivies de près.
Baidu Health teste en interne son assistant médical basé sur l'IA, DoctorClaw, pour la recherche documentaire et l'assistance administrative à court terme
Baidu Health aurait commencé à tester en interne un assistant intelligent basé sur l'IA, destiné aux médecins. Baptisé en interne « DoctorClaw » (la version « Lobster Doctor »), ce produit marque
Cursor Composer 2 contre Claude Opus 4.6 : un test de performance relance le débat sur la programmation par IA
Le 19 mars, Cursor a officiellement lancé son modèle de codage développé en interne, Composer 2. Cette annonce a immédiatement suscité des discussions au sein de la communauté des développeurs : selon
StrictlyVC San Francisco réunira des dirigeants de TDK Ventures, Replit et d'autres entreprises
Le premier événement StrictlyVC de l'année arrive à San Francisco plus tôt que vous ne le pensez. Il reste encore des billets pour notre rencontre du 30 avril au Sentro Filipino Cultural Center,











