Maison
Deepseek Shakes Ai Industrie: le prochain saut d'IA peut dépendre d'une augmentation du calcul à l'inférence, pas de plus de données

L'industrie de l'IA est en constante évolution, et 2025 apporte des développements bouleversants qui secouent le secteur. Un bouleversement majeur est survenu lorsque le laboratoire chinois d'IA, DeepSeek, a lâché une bombe avec un nouveau modèle qui a provoqué une chute de 17 % de l'action Nvidia et affecté d'autres actions de centres de données IA. Pourquoi tout ce buzz autour du modèle de DeepSeek ? Il offre des performances de premier ordre à une fraction du coût de ses concurrents américains, suscitant une tempête de discussions sur ce que cela signifie pour l'avenir des centres de données IA.
Mais pour vraiment comprendre ce que fait DeepSeek, il faut prendre du recul et examiner la situation dans son ensemble. Le monde de l'IA est confronté à une pénurie de données d'entraînement. Les grands acteurs ont déjà exploité la majeure partie des données publiques d'Internet, ce qui signifie que nous atteignons une limite dans les améliorations du pré-entraînement. En conséquence, l'industrie change de cap vers le "calcul au moment du test" (TTC). Considérez cela comme des modèles d'IA prenant un moment pour "réfléchir" avant de répondre, comme avec la série "o" d'OpenAI. On espère que le TTC pourra offrir le même type d'améliorations d'échelle que le pré-entraînement autrefois, ouvrant potentiellement la voie à la prochaine grande vague de percées en IA.
Ces changements signalent deux grandes évolutions : premièrement, les laboratoires à plus petit budget entrent désormais dans la course, en proposant des modèles de pointe. Deuxièmement, le TTC devient la nouvelle frontière pour faire avancer l'IA. Décomposons ces tendances et ce qu'elles pourraient signifier pour le paysage et le marché de l'IA.
Implications pour l'industrie de l'IA
Nous pensons que le passage au TTC et l'intensification de la concurrence entre les modèles de raisonnement pourraient remodeler le paysage de l'IA sur plusieurs fronts : matériel, plateformes cloud, modèles de base et logiciels d'entreprise.
1. Matériel (GPU, puces dédiées et infrastructure de calcul)
Le passage au TTC pourrait changer les besoins en matériel des entreprises d'IA et la manière dont elles le gèrent. Au lieu d'investir massivement dans des clusters de GPU toujours plus grands pour l'entraînement, elles pourraient se concentrer davantage sur le renforcement de leurs capacités d'inférence pour répondre aux exigences du TTC. Bien que les GPU resteront cruciaux pour l'inférence, la différence entre les charges de travail d'entraînement et d'inférence pourrait affecter la configuration et l'utilisation de ces puces. Les charges d'inférence étant plus imprévisibles et "en pics", la planification de la capacité pourrait devenir plus complexe.
Nous pensons également que ce changement pourrait stimuler le marché des matériels spécifiquement conçus pour l'inférence à faible latence, comme les ASICs. À mesure que le TTC devient plus crucial que la capacité d'entraînement, la domination des GPU à usage général pourrait commencer à décliner, ouvrant la voie aux fabricants de puces d'inférence spécialisées.
2. Plateformes cloud : Hyperscalers (AWS, Azure, GCP) et calcul cloud
Un obstacle majeur à l'adoption de l'IA dans les entreprises, outre les problèmes de précision, est la fiabilité des API d'inférence. Des problèmes comme des temps de réponse incohérents, des limites de débit et des difficultés avec les requêtes simultanées peuvent être un véritable casse-tête. Le TTC pourrait aggraver ces problèmes. Dans ce scénario, un fournisseur de cloud capable de garantir une haute qualité de service (QoS) pour résoudre ces problèmes pourrait prendre une longueur d'avance.
Fait intéressant, même si de nouvelles méthodes rendent l'IA plus efficace, elles pourraient ne pas réduire la demande de matériel. Selon le paradoxe de Jevons, où une plus grande efficacité entraîne une consommation accrue, des modèles d'inférence plus efficaces pourraient inciter davantage de développeurs à utiliser des modèles de raisonnement, augmentant ainsi la demande de puissance de calcul. Nous pensons que les récentes améliorations des modèles pourraient stimuler la demande de calcul cloud pour l'IA, tant pour l'inférence que pour l'entraînement de modèles plus petits et spécialisés.
3. Fournisseurs de modèles de base (OpenAI, Anthropic, Cohere, DeepSeek, Mistral)
Si de nouveaux entrants comme DeepSeek peuvent rivaliser avec les grands acteurs à une fraction du coût, le monopole des modèles pré-entraînés propriétaires pourrait commencer à s'effriter. Nous pouvons également nous attendre à davantage d'innovations dans le TTC pour les modèles de transformateurs, et comme DeepSeek l'a montré, ces innovations peuvent venir de sources inattendues en dehors des suspects habituels en IA.
4. Adoption de l'IA en entreprise et SaaS (couche applicative)
Étant donné les origines chinoises de DeepSeek, leurs produits feront probablement l'objet d'un examen continu en matière de sécurité et de confidentialité. Leurs API et services de chatbot basés en Chine ont peu de chances de séduire les clients d'IA d'entreprise aux États-Unis, au Canada ou dans d'autres pays occidentaux. De nombreuses entreprises bloquent déjà le site web et les applications de DeepSeek. Même lorsque les modèles de DeepSeek sont hébergés par des tiers dans des centres de données occidentaux, ils pourraient être examinés de près, ce qui pourrait limiter leur adoption en entreprise. Les chercheurs soulèvent des problèmes comme le jailbreaking, les biais et la génération de contenus nuisibles. Bien que certaines entreprises puissent expérimenter avec les modèles de DeepSeek, une adoption généralisée semble peu probable en raison de ces préoccupations.
D'un autre côté, la spécialisation verticale gagne du terrain. Par le passé, les applications verticales construites sur des modèles de base se concentraient sur la création de flux de travail sur mesure. Des techniques comme la génération augmentée par récupération (RAG), le routage de modèles, l'appel de fonctions et les garde-fous ont été essentielles pour adapter les modèles généralisés à ces cas d'utilisation spécifiques. Mais il y a toujours eu la crainte que des améliorations majeures des modèles sous-jacents ne rendent ces applications obsolètes. Sam Altman a un jour averti qu'un grand bond en avant dans les capacités des modèles pourrait "écraser" ces innovations.
Cependant, si nous observons un plafonnement des gains en calcul d'entraînement, la menace d'être rapidement dépassé diminue. Dans un monde où les améliorations de performance des modèles proviennent des optimisations du TTC, de nouvelles opportunités pourraient émerger pour les acteurs de la couche applicative. Des innovations comme l'optimisation structurée des prompts, les stratégies de raisonnement conscientes de la latence et les techniques d'échantillonnage efficaces pourraient offrir d'importants gains de performance dans des secteurs spécifiques.
Ces améliorations sont particulièrement pertinentes pour les modèles axés sur le raisonnement comme GPT-4o d'OpenAI et DeepSeek-R1, qui peuvent prendre plusieurs secondes à répondre. Dans les applications en temps réel, réduire la latence et améliorer la qualité de l'inférence dans un domaine spécifique pourrait offrir un avantage concurrentiel. En conséquence, les entreprises ayant une connaissance approfondie d'un domaine pourraient jouer un rôle crucial dans l'optimisation de l'efficacité de l'inférence et l'ajustement des résultats.
Le travail de DeepSeek montre que nous nous éloignons de la dépendance exclusive à un pré-entraînement accru pour améliorer la qualité des modèles. Au lieu de cela, le TTC devient de plus en plus important. Bien qu'il ne soit pas clair si les modèles de DeepSeek seront largement adoptés dans les logiciels d'entreprise en raison de l'examen auquel ils sont soumis, leur influence sur l'amélioration d'autres modèles devient de plus en plus évidente.
Nous pensons que les innovations de DeepSeek poussent les laboratoires d'IA établis à adopter des techniques similaires, complétant leurs avantages matériels existants. La baisse prévue des coûts des modèles semble stimuler une utilisation accrue des modèles, suivant le modèle du paradoxe de Jevons.
Pashootan Vaezipoor est responsable technique chez Georgian.
Article connexe
DeepSeek dévoile un modèle d'IA rivalisant avec les systèmes de pointe
Le laboratoire chinois d'IA DeepSeek a publié deux versions préliminaires de son tout dernier grand modèle linguistique, DeepSeek V4, une mise à jour très attendue du modèle V3.2 de l'année dernière e
Le modèle d'IA DeepSeek V3.2 offre des performances de haut niveau avec un coût de calcul minimal
Alors que les grandes entreprises technologiques investissent des milliards dans la puissance de calcul pour développer des modèles d'IA de pointe, la société chinoise DeepSeek a obtenu des résul
Les responsables de la sécurité appellent à une réglementation rapide de l'IA, en invoquant les risques liés à des outils tels que DeepSeek
L'inquiétude monte dans les centres d'opérations de sécurité, en particulier chez les responsables de la sécurité de l'information (CISO), avec une attention particulière pour le géant chinois de l'in
Recommandations de sujets spéciaux liés
commentaires (37)
Interessant, dass jetzt die Rechenleistung beim Inferenz wichtiger wird als mehr Daten. Aber ist das wirklich nachhaltig? Die Energiebilanz dieser riesigen Modelle macht mir Sorgen. Die Aktienkurse von Nvidia & Co. reagieren ja schon extrem auf solche News. 🧐
Interessant, dass jetzt die Rechenleistung beim Inferencing als Engpass gesehen wird. Aber irgendwie frage ich mich, ob das nicht nur die nächste Runde im Hardware-Wettlauf einläutet. Nvidia-Aktienkurse als Indikator für KI-Fortschritt zu nehmen finde ich etwas kurzsichtig 🤔 Die eigentliche Frage ist doch: Wer kann sich diese Rechenpower überhaupt leisten? Kleine Labs werden da noch weiter abgehängt.
DeepSeek's new model sounds like a real game-changer! A 17% drop in Nvidia's stock is wild—makes me wonder how much compute power is actually driving these AI leaps. Curious to see if this sparks a race for better inference tech! 🚀
DeepSeek's new model sounds like a game-changer! 🤯 I'm curious how this shift to more compute at inference will play out—could it make AI more accessible or just widen the gap between big players?

L'industrie de l'IA est en constante évolution, et 2025 apporte des développements bouleversants qui secouent le secteur. Un bouleversement majeur est survenu lorsque le laboratoire chinois d'IA, DeepSeek, a lâché une bombe avec un nouveau modèle qui a provoqué une chute de 17 % de l'action Nvidia et affecté d'autres actions de centres de données IA. Pourquoi tout ce buzz autour du modèle de DeepSeek ? Il offre des performances de premier ordre à une fraction du coût de ses concurrents américains, suscitant une tempête de discussions sur ce que cela signifie pour l'avenir des centres de données IA.
Mais pour vraiment comprendre ce que fait DeepSeek, il faut prendre du recul et examiner la situation dans son ensemble. Le monde de l'IA est confronté à une pénurie de données d'entraînement. Les grands acteurs ont déjà exploité la majeure partie des données publiques d'Internet, ce qui signifie que nous atteignons une limite dans les améliorations du pré-entraînement. En conséquence, l'industrie change de cap vers le "calcul au moment du test" (TTC). Considérez cela comme des modèles d'IA prenant un moment pour "réfléchir" avant de répondre, comme avec la série "o" d'OpenAI. On espère que le TTC pourra offrir le même type d'améliorations d'échelle que le pré-entraînement autrefois, ouvrant potentiellement la voie à la prochaine grande vague de percées en IA.
Ces changements signalent deux grandes évolutions : premièrement, les laboratoires à plus petit budget entrent désormais dans la course, en proposant des modèles de pointe. Deuxièmement, le TTC devient la nouvelle frontière pour faire avancer l'IA. Décomposons ces tendances et ce qu'elles pourraient signifier pour le paysage et le marché de l'IA.
Implications pour l'industrie de l'IA
Nous pensons que le passage au TTC et l'intensification de la concurrence entre les modèles de raisonnement pourraient remodeler le paysage de l'IA sur plusieurs fronts : matériel, plateformes cloud, modèles de base et logiciels d'entreprise.
1. Matériel (GPU, puces dédiées et infrastructure de calcul)
Le passage au TTC pourrait changer les besoins en matériel des entreprises d'IA et la manière dont elles le gèrent. Au lieu d'investir massivement dans des clusters de GPU toujours plus grands pour l'entraînement, elles pourraient se concentrer davantage sur le renforcement de leurs capacités d'inférence pour répondre aux exigences du TTC. Bien que les GPU resteront cruciaux pour l'inférence, la différence entre les charges de travail d'entraînement et d'inférence pourrait affecter la configuration et l'utilisation de ces puces. Les charges d'inférence étant plus imprévisibles et "en pics", la planification de la capacité pourrait devenir plus complexe.
Nous pensons également que ce changement pourrait stimuler le marché des matériels spécifiquement conçus pour l'inférence à faible latence, comme les ASICs. À mesure que le TTC devient plus crucial que la capacité d'entraînement, la domination des GPU à usage général pourrait commencer à décliner, ouvrant la voie aux fabricants de puces d'inférence spécialisées.
2. Plateformes cloud : Hyperscalers (AWS, Azure, GCP) et calcul cloud
Un obstacle majeur à l'adoption de l'IA dans les entreprises, outre les problèmes de précision, est la fiabilité des API d'inférence. Des problèmes comme des temps de réponse incohérents, des limites de débit et des difficultés avec les requêtes simultanées peuvent être un véritable casse-tête. Le TTC pourrait aggraver ces problèmes. Dans ce scénario, un fournisseur de cloud capable de garantir une haute qualité de service (QoS) pour résoudre ces problèmes pourrait prendre une longueur d'avance.
Fait intéressant, même si de nouvelles méthodes rendent l'IA plus efficace, elles pourraient ne pas réduire la demande de matériel. Selon le paradoxe de Jevons, où une plus grande efficacité entraîne une consommation accrue, des modèles d'inférence plus efficaces pourraient inciter davantage de développeurs à utiliser des modèles de raisonnement, augmentant ainsi la demande de puissance de calcul. Nous pensons que les récentes améliorations des modèles pourraient stimuler la demande de calcul cloud pour l'IA, tant pour l'inférence que pour l'entraînement de modèles plus petits et spécialisés.
3. Fournisseurs de modèles de base (OpenAI, Anthropic, Cohere, DeepSeek, Mistral)
Si de nouveaux entrants comme DeepSeek peuvent rivaliser avec les grands acteurs à une fraction du coût, le monopole des modèles pré-entraînés propriétaires pourrait commencer à s'effriter. Nous pouvons également nous attendre à davantage d'innovations dans le TTC pour les modèles de transformateurs, et comme DeepSeek l'a montré, ces innovations peuvent venir de sources inattendues en dehors des suspects habituels en IA.
4. Adoption de l'IA en entreprise et SaaS (couche applicative)
Étant donné les origines chinoises de DeepSeek, leurs produits feront probablement l'objet d'un examen continu en matière de sécurité et de confidentialité. Leurs API et services de chatbot basés en Chine ont peu de chances de séduire les clients d'IA d'entreprise aux États-Unis, au Canada ou dans d'autres pays occidentaux. De nombreuses entreprises bloquent déjà le site web et les applications de DeepSeek. Même lorsque les modèles de DeepSeek sont hébergés par des tiers dans des centres de données occidentaux, ils pourraient être examinés de près, ce qui pourrait limiter leur adoption en entreprise. Les chercheurs soulèvent des problèmes comme le jailbreaking, les biais et la génération de contenus nuisibles. Bien que certaines entreprises puissent expérimenter avec les modèles de DeepSeek, une adoption généralisée semble peu probable en raison de ces préoccupations.
D'un autre côté, la spécialisation verticale gagne du terrain. Par le passé, les applications verticales construites sur des modèles de base se concentraient sur la création de flux de travail sur mesure. Des techniques comme la génération augmentée par récupération (RAG), le routage de modèles, l'appel de fonctions et les garde-fous ont été essentielles pour adapter les modèles généralisés à ces cas d'utilisation spécifiques. Mais il y a toujours eu la crainte que des améliorations majeures des modèles sous-jacents ne rendent ces applications obsolètes. Sam Altman a un jour averti qu'un grand bond en avant dans les capacités des modèles pourrait "écraser" ces innovations.
Cependant, si nous observons un plafonnement des gains en calcul d'entraînement, la menace d'être rapidement dépassé diminue. Dans un monde où les améliorations de performance des modèles proviennent des optimisations du TTC, de nouvelles opportunités pourraient émerger pour les acteurs de la couche applicative. Des innovations comme l'optimisation structurée des prompts, les stratégies de raisonnement conscientes de la latence et les techniques d'échantillonnage efficaces pourraient offrir d'importants gains de performance dans des secteurs spécifiques.
Ces améliorations sont particulièrement pertinentes pour les modèles axés sur le raisonnement comme GPT-4o d'OpenAI et DeepSeek-R1, qui peuvent prendre plusieurs secondes à répondre. Dans les applications en temps réel, réduire la latence et améliorer la qualité de l'inférence dans un domaine spécifique pourrait offrir un avantage concurrentiel. En conséquence, les entreprises ayant une connaissance approfondie d'un domaine pourraient jouer un rôle crucial dans l'optimisation de l'efficacité de l'inférence et l'ajustement des résultats.
Le travail de DeepSeek montre que nous nous éloignons de la dépendance exclusive à un pré-entraînement accru pour améliorer la qualité des modèles. Au lieu de cela, le TTC devient de plus en plus important. Bien qu'il ne soit pas clair si les modèles de DeepSeek seront largement adoptés dans les logiciels d'entreprise en raison de l'examen auquel ils sont soumis, leur influence sur l'amélioration d'autres modèles devient de plus en plus évidente.
Nous pensons que les innovations de DeepSeek poussent les laboratoires d'IA établis à adopter des techniques similaires, complétant leurs avantages matériels existants. La baisse prévue des coûts des modèles semble stimuler une utilisation accrue des modèles, suivant le modèle du paradoxe de Jevons.
Pashootan Vaezipoor est responsable technique chez Georgian.
DeepSeek dévoile un modèle d'IA rivalisant avec les systèmes de pointe
Le laboratoire chinois d'IA DeepSeek a publié deux versions préliminaires de son tout dernier grand modèle linguistique, DeepSeek V4, une mise à jour très attendue du modèle V3.2 de l'année dernière e
Le modèle d'IA DeepSeek V3.2 offre des performances de haut niveau avec un coût de calcul minimal
Alors que les grandes entreprises technologiques investissent des milliards dans la puissance de calcul pour développer des modèles d'IA de pointe, la société chinoise DeepSeek a obtenu des résul
Les responsables de la sécurité appellent à une réglementation rapide de l'IA, en invoquant les risques liés à des outils tels que DeepSeek
L'inquiétude monte dans les centres d'opérations de sécurité, en particulier chez les responsables de la sécurité de l'information (CISO), avec une attention particulière pour le géant chinois de l'in
Interessant, dass jetzt die Rechenleistung beim Inferenz wichtiger wird als mehr Daten. Aber ist das wirklich nachhaltig? Die Energiebilanz dieser riesigen Modelle macht mir Sorgen. Die Aktienkurse von Nvidia & Co. reagieren ja schon extrem auf solche News. 🧐
Interessant, dass jetzt die Rechenleistung beim Inferencing als Engpass gesehen wird. Aber irgendwie frage ich mich, ob das nicht nur die nächste Runde im Hardware-Wettlauf einläutet. Nvidia-Aktienkurse als Indikator für KI-Fortschritt zu nehmen finde ich etwas kurzsichtig 🤔 Die eigentliche Frage ist doch: Wer kann sich diese Rechenpower überhaupt leisten? Kleine Labs werden da noch weiter abgehängt.
DeepSeek's new model sounds like a real game-changer! A 17% drop in Nvidia's stock is wild—makes me wonder how much compute power is actually driving these AI leaps. Curious to see if this sparks a race for better inference tech! 🚀
DeepSeek's new model sounds like a game-changer! 🤯 I'm curious how this shift to more compute at inference will play out—could it make AI more accessible or just widen the gap between big players?











