option
Maison
Nouvelles
Deepseek augmente les dépenses de l'IA, contrairement aux croyances

Deepseek augmente les dépenses de l'IA, contrairement aux croyances

10 mai 2025
55

Deepseek augmente les dépenses de l'IA, contrairement aux croyances

La chute du marché boursier en janvier, stimulée par l'engouement autour de la percée chinoise en IA DeepSeek AI et sa méthode de calcul économique, pourrait laisser penser que les entreprises réduisent leurs investissements dans les puces et systèmes d'IA. Cependant, mon expérience à la conférence sur l'IA générative à New York, organisée par Bloomberg Intelligence, a montré une réalité différente. L'enthousiasme pour élargir l'utilisation de l'IA générative était palpable, suggérant que les dépenses dans ce domaine sont loin de ralentir.

Aussi : Qu'est-ce que DeepSeek AI ? Est-ce sécurisé ? Voici tout ce que vous devez savoir

La conférence, intitulée "IA générative : Lois d'échelle après DeepSeek", était remplie de discussions soulignant la demande continue qui alimente l'augmentation des investissements dans l'IA.

"Nous avons eu dix panels aujourd'hui, et personne n'a dit que nous avions plus de capacité que nécessaire", a remarqué Mandeep Singh, analyste senior en technologie chez Bloomberg Intelligence et l'un des organisateurs de l'événement.

"Et personne ne parlait d'une bulle" dans les infrastructures, a ajouté Singh, soulignant la confiance de l'industrie dans l'avenir de l'IA.

La construction des infrastructures d'IA : Où en sommes-nous ?

Anurag Rana, collègue de Singh chez Bloomberg Intelligence et analyste senior des services informatiques et logiciels, a posé une question cruciale : "La question la plus importante actuellement pour tout le monde est la construction des infrastructures d'IA. Oui. Où en sommes-nous dans ce cycle ?"

"Personne ne sait" avec certitude, a admis Rana. Pourtant, l'espoir suscité par DeepSeek AI est que des avancées significatives peuvent être réalisées à moindre coût.

"DeepSeek a secoué beaucoup de monde", a-t-il dit. "Si vous n'avez pas besoin d'autant de GPU pour exécuter des modèles, alors pourquoi avons-nous besoin de 500 milliards de dollars pour le projet Stargate", a-t-il observé, en référence à un projet d'IA américain impliquant le groupe japonais SoftBank, OpenAI et Oracle.

Rana a noté que l'industrie espère que les coûts de l'IA vont chuter, à l'image de la baisse rapide des coûts du cloud computing.

Aussi : Le nouveau modèle d'image de DeepSeek est-il une autre victoire pour une IA moins chère ?

"Cette baisse de la courbe des coûts, qui a probablement pris six, sept, huit ans pour stocker un téraoctet de données sur Amazon AWS, au départ par rapport à aujourd'hui, l'économie était bonne", a-t-il dit. "Et c'est ce que tout le monde espère, que du côté de l'inférence" de l'IA, "si la courbe tombe à ce niveau, mon Dieu, le taux d'adoption de l'IA du côté des utilisateurs finaux, ou du côté des entreprises, sera spectaculaire."

Singh a acquiescé, notant que l'émergence de DeepSeek AI a "changé la mentalité de chacun sur l'efficacité."

Tout au long de la journée, de nombreux panels ont exploré les projets d'IA en entreprise, de leur conception à leur déploiement. Pourtant, un thème récurrent était la nécessité de réduire drastiquement les coûts de l'IA pour élargir son accessibilité.

"Je ne pense pas que DeepSeek ait été une surprise", a déclaré Shawn Edwards, technologue en chef de Bloomberg, dans une interview avec David Dwyer, chef de Bloomberg Intelligence. "Cela m'a fait penser qu'il serait formidable de pouvoir agiter une baguette magique et faire fonctionner ces modèles de manière incroyablement efficace", a-t-il dit, imaginant un futur où tous les modèles d'IA pourraient fonctionner avec une telle efficacité.

La prolifération des modèles d'IA

Une raison pour laquelle de nombreux panélistes anticipent une augmentation, plutôt qu'une diminution, des investissements dans les infrastructures d'IA est le nombre croissant de modèles d'IA. Une conclusion clé de la journée était qu'il n'y aura pas un seul modèle d'IA pour tout dominer.

"Nous utilisons une famille de modèles", a expliqué Edwards. "Il n'existe pas de meilleur modèle."

Les panélistes ont convenu que, bien que les modèles de langage "fondateurs" ou "frontières" continueront d'évoluer, les entreprises pourraient employer des centaines, voire des milliers de modèles d'IA.

Aussi : L'essor des PC IA : Comment les entreprises adaptent leur technologie pour suivre

Ces modèles pourraient être affinés sur les données propriétaires d'une entreprise, un processus de réentraînement d'un réseau neuronal après son "pré-entraînement" initial sur des données génériques.

"Les agents en entreprise nécessitent une optionalité parmi les modèles", a déclaré Jed Dougherty, chef de la stratégie de plateforme pour la firme de science des données soutenue par du capital-risque Dataiku. "Ils ont besoin de la capacité de contrôler et de créer, et d'avoir une auditabilité" des modèles d'IA.

"Nous voulons mettre les outils pour construire ces choses entre les mains des gens", a-t-il dit. "Nous ne voulons pas que dix docteurs construisent tous les agents."

Dans le même ordre d'idées, Adobe, leader dans les outils de conception, mise sur des modèles personnalisés comme cas d'utilisation clé pour les créatifs. "Nous pouvons entraîner des extensions de modèles personnalisés pour votre marque qui peuvent aider pour une nouvelle campagne publicitaire", a déclaré Hannah Elsakr, responsable des nouvelles entreprises chez Adobe, dans une discussion avec l'animateur de Bloomberg TV, Romaine Bostick.

Demande croissante de traitement

Comme pour les modèles d'IA, la prolifération des agents d'IA au sein des entreprises augmente les besoins de traitement, ont suggéré de nombreux intervenants.

"Vous ne compresserez pas tout un processus dans un seul agent, vous le diviserez en parties", a déclaré Ray Smith, responsable des agents et de l'automatisation chez Copilot Studio de Microsoft.

Smith a prédit qu'à travers une seule interface, comme Copilot, "nous interagirons avec des centaines d'agents – ce sont juste des applications dans le nouveau monde" de la programmation.

"Nous donnerons le processus métier à l'agent, lui dirons ce que nous voulons accomplir", et l'agent exécutera les tâches. "Les applications agentiques sont juste une nouvelle façon de gérer les flux de travail", a-t-il dit.

Aussi : Nvidia domine les benchmarks d'IA générative, surpassant 2 puces d'IA rivales

De tels scénarios quotidiens sont "tous technologiquement possibles", a noté Smith, "c'est juste le rythme auquel nous les développons."

La volonté d'apporter des "agents" d'IA à davantage de personnes au sein des organisations nécessite davantage de réductions de coûts, a déclaré James McNiven, responsable de la gestion de produits pour le fabricant de microprocesseurs ARM Holdings, dans une discussion avec Hyde de Bloomberg.

"Comment fournissons-nous l'accès sur de plus en plus d'appareils", a-t-il posé. "Nous voyons des modèles au niveau d'un doctorat" en termes de capacités, a-t-il dit.

McNiven a suggéré que de tels agents devraient servir d'assistants aux humains, établissant un parallèle avec l'introduction des systèmes de paiement dans les pays en développement via les téléphones mobiles il y a une décennie : "Comment faisons-nous pour que cela atteigne les personnes qui peuvent utiliser cette capacité ?"

La prolifération des modèles fondateurs

Même les modèles fondateurs génériques se multiplient à un rythme étonnant.

Amazon AWS dispose de 1 800 modèles d'IA différents disponibles, a déclaré Dave Brown, responsable de l'informatique et des réseaux chez AWS, à l'animatrice de Bloomberg TV, Caroline Hyde. L'entreprise "fait beaucoup pour réduire les coûts" d'exécution des modèles, a-t-il dit, y compris en développant des puces d'IA personnalisées, comme Trainium.

AWS "utilise plus de nos propres processeurs que ceux d'autres entreprises", a déclaré Brown, faisant allusion à Nvidia, AMD, Intel et autres fournisseurs de puces à usage général.

Aussi : Le nouveau générateur d'images de ChatGPT a dépassé mes attentes - et maintenant il est gratuit à essayer

"Les clients feraient plus si les coûts étaient plus bas", a déclaré Brown.

AWS travaille quotidiennement avec Anthropic, créateurs de la famille de modèles de langage Claude, a noté Brown. Michael Gerstenhaber, responsable des interfaces de programmation d'applications chez Anthropic, dans la même discussion avec Hyde, a noté que "les modèles pensants consomment beaucoup de capacité", en référence à la tendance des modèles dits de raisonnement, comme DeepSeek R1 et GPT-o1, à produire des déclarations verbeuses sur les arguments de leurs réponses finales.

Anthropic travaille en étroite collaboration avec AWS sur des moyens de réduire le budget de calcul, comme le "prompt caching", stockant les calculs des réponses précédentes.

Malgré cette tendance, a-t-il dit, "Anthropic a besoin de centaines de milliers d'accélérateurs", c'est-à-dire des puces de silicium axées sur l'IA, "à travers de nombreux centres de données" pour exécuter ses modèles.

En outre, le coût énergétique croissant pour alimenter l'IA ne montre aucun signe de ralentissement, a déclaré Brown. Les centres de données actuels consomment des centaines de mégawatts, a-t-il noté, et nécessiteront éventuellement des gigawatts. "La puissance qu'elle consomme", c'est-à-dire l'IA, "est importante, et l'empreinte est grande dans de nombreux centres de données."

Aussi : L'IA mondiale consommera "plusieurs villes de New York" en énergie d'ici 2026, selon un fondateur

Incertitude économique et investissement dans l'IA

Malgré les scénarios ambitieux, un facteur pourrait perturber tous les cas d'utilisation et plans d'investissement : l'économie.

Alors que la conférence se terminait mercredi soir, les panélistes et les invités surveillaient la chute après clôture du marché boursier. Le président américain Donald Trump venait d'annoncer un ensemble mondial de tarifs douaniers plus vastes et plus complets que ce que la plupart des analystes de Wall Street avaient anticipé.

Les domaines traditionnels d'investissement technologique, comme les serveurs et le stockage, et non l'IA, pourraient être les premières victimes d'une contraction économique, a déclaré Rana de Bloomberg.

"L'autre grande chose sur laquelle nous nous concentrons est la dépense technologique non liée à l'IA", a-t-il dit à propos des tarifs. "Quand nous regardons des entreprises comme IBM, Accenture, Microsoft, et toutes les autres, en mettant l'IA de côté un instant, c'est quelque chose qui va être un défi pour cette saison des résultats."

Les directeurs financiers des grandes entreprises pourraient prioriser l'IA et réallouer des fonds, même s'ils doivent réduire leurs budgets face à l'incertitude économique et une éventuelle récession, a suggéré Rana.

Cependant, cette perspective optimiste n'est pas garantie.

"Ce qui m'intéresse le plus, c'est de savoir si toutes ces grandes entreprises vont maintenir leurs objectifs de dépenses en capital", a déclaré Rana, y compris les centres de données pour l'IA, "ou vont-elles dire, vous savez quoi ? C'est trop incertain."

Article connexe
Élevez Vos Images avec HitPaw AI Photo Enhancer : Un Guide Complet Élevez Vos Images avec HitPaw AI Photo Enhancer : Un Guide Complet Voulez-vous transformer votre expérience d'édition de photos ? Grâce à une intelligence artificielle de pointe, améliorer vos images est désormais sans effort. Ce guide détaillé explore le HitPaw AI P
Création musicale alimentée par l'IA : Créez des chansons et des vidéos sans effort Création musicale alimentée par l'IA : Créez des chansons et des vidéos sans effort La création musicale peut être complexe, nécessitant du temps, des ressources et une expertise. L'intelligence artificielle a transformé ce processus, le rendant simple et accessible. Ce guide montre
Création de livres de coloriage alimentés par l'IA : Un guide complet Création de livres de coloriage alimentés par l'IA : Un guide complet Concevoir des livres de coloriage est une entreprise gratifiante, combinant expression artistique et expériences apaisantes pour les utilisateurs. Cependant, le processus peut être laborieux. Heureuse
commentaires (1)
0/200
FredGreen
FredGreen 31 juillet 2025 03:41:19 UTC+02:00

DeepSeek's breakthrough sounds like a game-changer! Curious how their cost-effective method stacks up against giants like NVIDIA. Anyone got details on this? 🤔

Retour en haut
OR