Maison
Le prix du cache d'entrée de l'API DeepSeek a été réduit à un dixième de son prix initial
DeepSeek, le principal modèle linguistique de grande envergure du marché national, a récemment annoncé une baisse de prix significative, ramenant le coût des requêtes avec cache pour toutes les séries d'API à un dixième du tarif initial. Cette initiative marque une nouvelle étape dans la gestion des coûts de l'IA nationale et vise à attirer davantage de développeurs et d'entreprises en offrant un rapport qualité-prix exceptionnel.
Des baisses de prix ciblées pour répondre aux difficultés du secteur
Cet ajustement tarifaire concerne l'ensemble des séries V4-Pro et V4-Flash. Le prix du cache d'entrée pour V4-Pro a été ramené à 0,1 RMB par million de tokens, et grâce à une promotion à durée limitée, le paiement effectif n'est que de 0,025 RMB. Par rapport aux concurrents étrangers, le prix du cache d'entrée ne représente que 1/700e de celui du GPT-5.5 Pro, ce qui démontre une forte compétitivité sur le marché.
Outre les scénarios de cache hit, les prix pour les scénarios de cache miss et de sortie ont également été réduits à un quart du prix d'origine. Cette stratégie tarifaire cible précisément les cas d'utilisation à haute fréquence tels que les bases de connaissances RAG, le service client intelligent et l'analyse de documents, ce qui pourrait réduire les coûts opérationnels des entreprises de plus de 90 %.

La capacité de DeepSeek à réduire considérablement les prix découle de son architecture d'attention clairsemée développée en interne. Cette technologie prend en charge le traitement de contextes ultra-longs pouvant atteindre 160 000 caractères, améliorant ainsi l'efficacité du traitement des textes longs tout en réduisant efficacement la consommation de puissance de calcul sous-jacente et les coûts de stockage.
Article connexe
Google lance un outil d'intelligence artificielle sécurisée pour défier Ansopek dans le duel de code Code Face-Off
Lors de la conférence des développeurs I/O récente, Google a dévoilé une initiative majeure en matière de cybersécurité. L’entreprise a invité un groupe sélectionné d’experts à effectuer des tests API sur CodeMender, un agent AI conçu pour la sécurit
Comment rédiger des titres optimisés pour le référencement sur Google Japon en 2025 ?
Les rédacteurs de contenu SEO se trouvent dans une situation délicate. Les réalités économiques du secteur les poussent à produire en grande quantité, et l'IA permet d'atteindre ce volume. M
Le NDRC met en place une infrastructure de formation à l'intelligence incarnée pour les modèles cérébraux grands et petits
Lors d’une conférence de presse récente, Li Chao, directeur adjoint du Bureau de recherche politique de la Commission nationale du développement et de la réforme, a annoncé que la prochaine étape se concentrerait sur le développement de haute qualité
Recommandations de sujets spéciaux liés
commentaires (0)
DeepSeek, le principal modèle linguistique de grande envergure du marché national, a récemment annoncé une baisse de prix significative, ramenant le coût des requêtes avec cache pour toutes les séries d'API à un dixième du tarif initial. Cette initiative marque une nouvelle étape dans la gestion des coûts de l'IA nationale et vise à attirer davantage de développeurs et d'entreprises en offrant un rapport qualité-prix exceptionnel.
Des baisses de prix ciblées pour répondre aux difficultés du secteur
Cet ajustement tarifaire concerne l'ensemble des séries V4-Pro et V4-Flash. Le prix du cache d'entrée pour V4-Pro a été ramené à 0,1 RMB par million de tokens, et grâce à une promotion à durée limitée, le paiement effectif n'est que de 0,025 RMB. Par rapport aux concurrents étrangers, le prix du cache d'entrée ne représente que 1/700e de celui du GPT-5.5 Pro, ce qui démontre une forte compétitivité sur le marché.
Outre les scénarios de cache hit, les prix pour les scénarios de cache miss et de sortie ont également été réduits à un quart du prix d'origine. Cette stratégie tarifaire cible précisément les cas d'utilisation à haute fréquence tels que les bases de connaissances RAG, le service client intelligent et l'analyse de documents, ce qui pourrait réduire les coûts opérationnels des entreprises de plus de 90 %.

La capacité de DeepSeek à réduire considérablement les prix découle de son architecture d'attention clairsemée développée en interne. Cette technologie prend en charge le traitement de contextes ultra-longs pouvant atteindre 160 000 caractères, améliorant ainsi l'efficacité du traitement des textes longs tout en réduisant efficacement la consommation de puissance de calcul sous-jacente et les coûts de stockage.
Google lance un outil d'intelligence artificielle sécurisée pour défier Ansopek dans le duel de code Code Face-Off
Lors de la conférence des développeurs I/O récente, Google a dévoilé une initiative majeure en matière de cybersécurité. L’entreprise a invité un groupe sélectionné d’experts à effectuer des tests API sur CodeMender, un agent AI conçu pour la sécurit
Comment rédiger des titres optimisés pour le référencement sur Google Japon en 2025 ?
Les rédacteurs de contenu SEO se trouvent dans une situation délicate. Les réalités économiques du secteur les poussent à produire en grande quantité, et l'IA permet d'atteindre ce volume. M
Le NDRC met en place une infrastructure de formation à l'intelligence incarnée pour les modèles cérébraux grands et petits
Lors d’une conférence de presse récente, Li Chao, directeur adjoint du Bureau de recherche politique de la Commission nationale du développement et de la réforme, a annoncé que la prochaine étape se concentrerait sur le développement de haute qualité











