L'engouement de Nvidia pour l'IA se heurte à la réalité : les marges de 70 % font l'objet d'un examen minutieux dans le cadre des batailles d'inférence

Maison

Nouvelles

2 octobre 2025

KennethMartin

# openai # cursor # nvda-2

La guerre des puces d'IA fait rage à VB Transform 2025

Les lignes de combat ont été tracées lors d'une table ronde enflammée à VB Transform 2025, au cours de laquelle des challengers en plein essor se sont attaqués directement à la position dominante de Nvidia sur le marché. La question centrale a mis en évidence une contradiction flagrante : Comment l'inférence de l'IA peut-elle être décrite comme une "usine" banalisée tout en offrant des marges brutes massives de 70 % ?

Les challengers s'expriment

Jonathan Ross, PDG de Groq, a coupé court à la rhétorique de l'industrie : L'"usine d'IA" n'est qu'un slogan marketing visant à rendre l'IA moins intimidante. Sean Lie, directeur technique de Cerebras, a ajouté une critique acerbe : "Nvidia se réjouit de voir les fournisseurs de services se battre pour des miettes tout en conservant leurs confortables marges bénéficiaires.

Alors que des milliers de milliards d'euros d'investissements dans l'infrastructure sont en jeu, ces remarques ont révélé des vérités difficiles à comprendre sur les raisons pour lesquelles les initiatives d'IA des entreprises continuent de se heurter à des goulets d'étranglement inattendus.

La crise de capacité cachée

Le fondateur de SemiAnalysis, Dylan Patel, a exposé la gravité de la situation : "Les grands utilisateurs d'IA négocient constamment pour obtenir plus de capacité - d'abord avec les fournisseurs de modèles, qui doivent ensuite supplier les fournisseurs de matériel pour obtenir des ressources supplémentaires." Cette rupture de la chaîne d'approvisionnement révèle des failles fondamentales dans l'économie de l'IA de type industriel.

La métaphore de la fabrication ne tient pas la route

Contrairement à la fabrication traditionnelle qui s'adapte à la demande, l'infrastructure de l'IA est soumise à des contraintes rigides :

l'approvisionnement en GPU nécessite des délais de 24 mois
La construction d'un centre de données dépend de l'obtention d'un permis et de contrats d'approvisionnement en électricité.
L'infrastructure actuelle ne peut pas répondre aux demandes de croissance exponentielle.

Les données du marché confirment une croissance spectaculaire avec un soutien insuffisant :

Anthropic a fait un bond de 1 milliard de dollars en ARR en l'espace de six mois.
Cursor est passé de zéro à 500 millions de dollars d'ARR.
OpenAI a dépassé les 10 milliards de dollars alors que les utilisateurs sont toujours confrontés à une pénurie de jetons.

Trois failles fatales dans la logique de l'usine d'IA

1. Des performances hors normes

"La vitesse d'inférence varie considérablement d'un fournisseur à l'autre", note M. Patel. "Certains proposent des taux budgétaires de seulement 20 tokens/seconde - plus lents que la parole humaine.

2. Incohérence de la qualité

M. Ross a établi un parallèle avec les premiers marchés pétroliers : "Tout comme la qualité du pétrole brut varie dangereusement, les résultats actuels de l'IA fluctuent en fonction des techniques de réduction des coûts. Les optimisations courantes telles que la quantification et l'élagage dégradent souvent les performances des modèles.

3. Une économie inversée

Ross explique ce paradoxe : "Normalement, dépenser plus pour l'hébergement n'améliore pas la qualité du logiciel. Avec l'IA, le budget a un impact direct sur la fidélité des résultats". Cela crée des niveaux de prix supérieurs qui contredisent les hypothèses sur les produits de base.

La méta validation

Lorsque Mark Zuckerberg a distingué Groq comme fournissant des résultats de "qualité totale", il a mis en évidence une crise de la qualité à l'échelle du secteur. Les fournisseurs qui rognent sur les coûts créent une dégradation invisible des performances que seuls les utilisateurs avertis peuvent détecter.

Les impératifs de l'entreprise

Établir des critères de qualité rigoureux
Auditer les fournisseurs existants pour détecter les optimisations non divulguées
Accepter des prix plus élevés pour garantir la fidélité du modèle

Le paradoxe du jeton de 1 million de dollars

Lie a mis en évidence le décalage entre les prix pratiqués par l'industrie : "Si les jetons d'IA offrent une valeur transformatrice comme le travail juridique, pourquoi nous précipitons-nous vers des prix inférieurs à 1,50 dollar ?" Les ratios actuels 1:1 entre les dépenses et les revenus des jetons révèlent une économie non viable masquée par des récits d'usine.

Percées en matière de performances

Le matériel de nouvelle génération permet d'améliorer les fonctions par étapes. "Notre technologie à l'échelle de la plaquette permet de multiplier la vitesse par 10 à 50 par rapport aux GPU", a déclaré M. Lie. Ces gains permettent des flux de travail agentiques en temps réel, auparavant impossibles, plutôt qu'un traitement par lots du jour au lendemain.

Le véritable goulot d'étranglement

"La crise n'est pas liée à l'approvisionnement en puces, mais à la capacité et à la puissance des centres de données", a révélé M. Patel. La course mondiale aux ressources explique pourquoi les entreprises se tournent vers des régions riches en énergie comme le Moyen-Orient pour trouver des solutions.

L'exemple de Google

M. Ross a fait référence au phénomène de "Success Disaster" de Google : "Lorsque l'IA surpasse soudainement les humains, la demande explose au-delà de la capacité de l'infrastructure". Ce schéma se répète aujourd'hui dans les entreprises, sans qu'aucune courbe d'évolution régulière ne soit disponible.

Des changements dans la stratégie de l'entreprise sont nécessaires

Remplacer les prévisions linéaires par une gestion dynamique des capacités
Budgétiser des primes de performance là où la vitesse est importante
Donner la priorité aux avantages architecturaux plutôt qu'à l'optimisation incrémentale
S'assurer de la capacité d'alimentation et de l'espace du centre de données des années à l'avance.

Les nouvelles réalités du marché

La métaphore de l'usine représente dangereusement mal le paysage actuel de l'infrastructure de l'IA. Les entreprises doivent faire face à trois dures vérités :

Le marché des fournisseurs: La rareté des capacités donne aux fournisseurs tout le pouvoir de négociation.
L'écart de qualité: L'écart de performance de 5 % fait ou défait les applications
Contraintes physiques: Les kilowatts et la capacité de refroidissement fixent des limites strictes.

Pour aller de l'avant, il faut abandonner les fantasmes de banalisation. Les priorités stratégiques doivent être les suivantes :

Garantir une capacité supérieure à tout prix
Des processus rigoureux de vérification de la qualité
Investissements à long terme dans l'infrastructure
l'adaptation du matériel à la charge de travail.

La conclusion du panel a été unanime : dans la course à l'armement de l'IA, la qualité et la performance exigent des prix élevés, tandis que la logique d'usine conduit directement à des contraintes de capacité et à des compromis.

Article connexe

OpenAI met à jour ChatGPT Pro vers o3, augmentant la valeur de l'abonnement mensuel de 200 $. Cette semaine a été marquée par d'importants développements en matière d'IA de la part de géants de la technologie tels que Microsoft, Google et Anthropic. OpenAI conclut cette vague d'annonces avec s

Un organisme à but non lucratif s'appuie sur des agents d'intelligence artificielle pour stimuler la collecte de fonds à des fins caritatives Alors que les grandes entreprises technologiques promeuvent les "agents" d'IA comme des stimulants de la productivité pour les entreprises, une organisation à but non lucratif démontre leur potentiel

Les plus grands laboratoires d'IA avertissent que l'humanité est en train de perdre le contrôle de la compréhension des systèmes d'IA Dans une démonstration d'unité sans précédent, des chercheurs d'OpenAI, de Google DeepMind, d'Anthropic et de Meta ont mis de côté leurs divergences pour lancer un avertissement collectif sur le dével

commentaires (0)

0/200

Soumettre

Top nouvelles

Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives Gemini 2.5 Pro maintenant illimité et moins cher que Claude, GPT-4O Doublage par IA : Guide ultime pour la création de voix réalistes L'IA du cambium transforme le bois de déchet en bois OpenAI améliore l'assistant vocal AI pour de meilleurs chats Comment vous assurer que vos données sont dignes de confiance pour l'intégration de l'IA Notebooklm se développe à l'échelle mondiale, ajoute des diapositives et une vérification des faits améliorée AI Builder et Power Automate Révolutionnent la Synthèse de Documents Les ajustements aux centres de données américains pourraient débloquer 76 GW de nouvelle capacité d'énergie Google utilise l'IA pour suspendre plus de 39 millions de comptes d'annonces pour une fraude présumée

Plus

En vedette