option
Maison Nouvelles Deepseek Shakes Ai Industrie: le prochain saut d'IA peut dépendre d'une augmentation du calcul à l'inférence, pas de plus de données

Deepseek Shakes Ai Industrie: le prochain saut d'IA peut dépendre d'une augmentation du calcul à l'inférence, pas de plus de données

date de sortie date de sortie 17 avril 2025
Auteur Auteur AlbertWalker
vues vues 48

Deepseek Shakes Ai Industrie: le prochain saut d'IA peut dépendre d'une augmentation du calcul à l'inférence, pas de plus de données

L'industrie de l'IA est dans un état de flux constant, 2025 apportant des développements qui changent la donne qui font bouger les choses. Un remaniement majeur est venu lorsque le laboratoire de l'IA chinois, Deepseek, a abandonné une bombe avec un nouveau modèle qui a provoqué une baisse de 17% des actions de Nvidia et a affecté d'autres actions de centre de données d'IA. Le buzz autour du modèle de Deepseek? Il offre des performances de premier ordre à une fraction de ce qu'elle coûte aux autres concurrents américains, suscitant une tempête sur ce que cela signifie pour l'avenir des centres de données d'IA.

Mais pour vraiment obtenir ce que fait Deepseek, nous devons zoomer et regarder la situation dans son ensemble. Le monde de l'IA est aux prises avec une rareté de données de formation. Les grands acteurs ont déjà mâché la plupart des données publiques sur Internet, ce qui signifie que nous frappons un mur dans des améliorations préalables. En conséquence, le changement de vitesse de l'industrie vers le "calcul du temps de test" (TTC). Pensez-y comme des modèles AI prenant un moment pour "penser" avant de répondre, comme avec la série "O" d'Openai. Il y a l'espoir que TTC puisse offrir le même type d'améliorations de mise à l'échelle que la pré-formation une fois, inaugurant potentiellement la prochaine grande vague de percées d'IA.

Ces changements signalent deux grands changements: d'abord, des laboratoires à petit budget sont maintenant dans le jeu, publiant des modèles de pointe. Deuxièmement, TTC devient la nouvelle frontière pour faire avancer l'IA en avant. Décomposons ces tendances et ce qu'ils pourraient signifier pour le paysage et le marché de l'IA.

Implications pour l'industrie de l'IA

Nous pensons que le passage à la TTC et la montée en puissance en concurrence entre les modèles de raisonnement pourraient remodeler le paysage de l'IA sur plusieurs fronts: matériel, plates-formes cloud, modèles de fondation et logiciels d'entreprise.

1. matériel (GPU, puces dédiées et infrastructure de calcul)

Le passage à la TTC pourrait modifier ce dont les sociétés d'IA matériel ont besoin et comment elles le gérent. Au lieu de verser de l'argent dans des clusters GPU toujours plus lanciers pour la formation, ils pourraient commencer à se concentrer davantage sur le renforcement de leurs capacités d'inférence pour gérer les demandes de TTC. Bien que les GPU soient toujours cruciaux pour l'inférence, la différence entre la formation et les charges de travail d'inférence pourraient affecter la façon dont ces puces sont configurées et utilisées. Les charges de travail en inférence étant plus imprévisibles et «épineuses», la planification de la capacité pourrait devenir plus délicate.

Nous pensons également que ce changement pourrait stimuler le marché du matériel spécialement conçu pour une inférence à faible latence, comme les ASIC. À mesure que la TTC devient plus cruciale que la capacité de formation, le règne des GPU à usage général pourrait commencer à décliner, ouvrant les portes pour des fabricants de puces d'inférence spécialisés.

2. Plate-forme cloud: hyperscalers (AWS, Azure, GCP) et Cloud Compute

Un obstacle majeur pour l'adoption de l'IA dans les entreprises, en dehors des problèmes de précision, est le manque de fiabilité des API d'inférence. Des choses comme les temps de réponse incohérentes, les limites de taux et les problèmes avec les demandes simultanées peuvent être un véritable mal de tête. TTC pourrait aggraver ces problèmes. Dans ce scénario, un fournisseur de cloud qui peut garantir une qualité de service de haute qualité (QoS) pour résoudre ces problèmes pourrait avoir une grande longueur d'avance.

Fait intéressant, même si les nouvelles méthodes peuvent rendre l'IA plus efficace, elles pourraient ne pas réduire la demande de matériel. Suivant le paradoxe des Jevons, où plus d'efficacité conduit à plus de consommation, des modèles d'inférence plus efficaces pourraient inciter davantage de développeurs à utiliser des modèles de raisonnement, augmentant le besoin de calcul de la puissance. Nous pensons que les améliorations récentes des modèles pourraient stimuler davantage de demande de calculs de nuages, à la fois pour l'inférence et une formation de modèle spécialisée plus petite et spécialisée.

3. Foundation Model Providers (Openai, Anthropic, Cohere, Deepseek, Mistral)

Si de nouveaux entrants comme Deepseek peuvent aller de côté avec les gros canons à une fraction du coût, le bastion des modèles pré-entraînés propriétaires pourrait commencer à s'effondrer. Nous pouvons également nous attendre à plus d'innovations dans TTC pour les modèles de transformateurs, et comme Deepseek l'a montré, ces innovations peuvent provenir de endroits inattendus en dehors des suspects habituels de l'IA.

4. Adoption de l'IA d'entreprise et SaaS (couche de demande)

Compte tenu des racines de Deepseek en Chine, il y aura forcément un examen minutieux de leurs produits du point de vue de la sécurité et de la confidentialité. Il est peu probable que leurs services d'API et de chatbot basés en Chine se soient compliqués avec les clients de l'IA d'entreprise aux États-Unis, au Canada ou dans d'autres pays occidentaux. De nombreuses entreprises bloquent déjà le site Web et les applications de Deepseek. Même lorsqu'ils sont hébergés par des tiers dans les centres de données occidentaux, les modèles de Deepseek pourraient faire face à un examen minutieux, ce qui pourrait limiter leur adoption dans l'entreprise. Les chercheurs signalent des problèmes tels que le jailbreaking, les biais et la génération de contenu nuisible. Bien que certaines entreprises puissent expérimenter les modèles de Deepseek, une adoption généralisée semble peu probable en raison de ces préoccupations.

Sur une autre note, la spécialisation verticale gagne du terrain. Dans le passé, les applications verticales construites sur les modèles de fondation visaient à la création de workflows sur mesure. Des techniques telles que la génération de la récupération (RAG), le routage des modèles, les appels de fonction et les garde-corps ont été clés pour peaufiner des modèles généralisés pour ces cas d'utilisation spécifiques. Mais il y a toujours eu l'inquiétude que des améliorations majeures aux modèles sous-jacentes puissent rendre ces applications obsolètes. Sam Altman a averti une fois qu'un grand saut dans les capacités du modèle pourrait "cuire à la vapeur" ces innovations.

Cependant, si nous voyons un plateau dans les gains de calcul en train en train, la menace d'être rapidement dépassé les baisse. Dans un monde où les améliorations des performances du modèle proviennent des optimisations de la TTC, de nouvelles opportunités pourraient émerger pour les joueurs de couche d'application. Des innovations telles que l'optimisation rapide de l'invite, les stratégies de raisonnement sensible à la latence et les techniques d'échantillonnage efficaces pourraient offrir de grandes augmentations de performances dans des secteurs verticaux spécifiques.

Ces améliorations sont particulièrement pertinentes pour les modèles axés sur le raisonnement comme GPT-4O et Deepseek-R1 d'OpenAI, qui peuvent prendre plusieurs secondes pour répondre. Dans les applications en temps réel, réduire la latence et améliorer la qualité de l'inférence dans un domaine spécifique pourrait donner un avantage concurrentiel. En conséquence, les entreprises ayant des connaissances profondes du domaine pourraient jouer un rôle crucial dans l'optimisation de l'efficacité des inférences et des résultats fins.

Les travaux de Deepseek montrent que nous nous éloignons de la compatition uniquement de plus de pré-formation pour améliorer la qualité du modèle. Au lieu de cela, TTC devient de plus en plus important. Bien qu'il ne soit pas clair si les modèles de Deepseek seront largement adoptés dans les logiciels d'entreprise en raison d'un examen minutieux, leur influence sur l'amélioration d'autres modèles devient de plus en plus évidente.

Nous pensons que les innovations de Deepseek poussent les laboratoires AI établis à adopter des techniques similaires, complétant leurs avantages matériels existants. La baisse prévue des coûts du modèle semble entraîner plus d'utilisation du modèle, ajustant le modèle de paradoxe Jevons.

Pashootan Vaezipoor est en tête technique chez Georgian.

Article connexe
前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen 人工智能代理年度:仔細研究2025年的期望和現實2025年被許多專家預示為當年的AI代理商(由高級大型語言和多式聯運公司提供支持的AI代理商),來自OpenAI,Anthropic,Google和Google和Deepseek等公司,最終將帶上中心中心中心中心。
DeepSeek的AIS發現了真正的人類慾望 DeepSeek的AIS發現了真正的人類慾望 DeepSeek在AI獎勵模型中的突破性:加強AI推理和響應中國AI初創公司DeepSeek與Tsinghua University合作,在AI研究中取得了重要的里程碑。他們對AI獎勵模型的創新方法有望徹底改變AI系統的學習方式
研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手 研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手 上週五,斯坦福大學和華盛頓大學的AI專家的一份開創性的研究論文襲擊了現場,透露,他們設法開發了一種被稱為S1的AI“推理”模型,以低於50美元的雲計算學分。 S1擁有自己的AI世界,這種啟示正在震撼AI世界
commentaires (30)
0/200
JohnRoberts
JohnRoberts 18 avril 2025 12:09:37 UTC

DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻

WalterWhite
WalterWhite 18 avril 2025 12:09:37 UTC

DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻

RogerPerez
RogerPerez 18 avril 2025 12:09:37 UTC

DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻

PatrickMartinez
PatrickMartinez 18 avril 2025 12:09:37 UTC

O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻

ScottPerez
ScottPerez 18 avril 2025 12:09:37 UTC

El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻

SophiaCampbell
SophiaCampbell 18 avril 2025 17:57:57 UTC

DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀

Retour en haut
OR