Maison
Le plugin vLLM-ATOM d'AMD améliore les performances d'inférence des grands modèles d'IA destinés à un usage domestique
AMD a officiellement lancé le plugin vLLM-ATOM, spécialement conçu pour le déploiement de grands modèles linguistiques. Ce plugin vise à améliorer considérablement les performances d'inférence des grands modèles nationaux courants, tels que DeepSeek-R1 et Kimi-K2, sur le matériel AMD, sans perturber les flux de travail existants.
En tant que framework d'inférence open source conçu pour les scénarios à forte concurrence, vLLM est réputé pour son excellente efficacité mémoire. Le nouveau plugin d'AMD offre une solution d'optimisation plus personnalisée pour ses GPU de la série Instinct, permettant aux développeurs de réaliser une migration technique avec un effort d'apprentissage minimal.

Amélioration transparente des performances
Le principal avantage du plugin vLLM-ATOM réside dans son déploiement « sans coût ». Les utilisateurs n’ont pas besoin de modifier leurs API existantes ni leurs workflows de bout en bout. Le plugin gère et optimise automatiquement la planification des requêtes et le réglage du noyau en arrière-plan, permettant aux services actuels de migrer en douceur vers le backend matériel AMD.
Sur le plan architectural, le plugin est structuré en trois couches : la couche supérieure assure la compatibilité avec l'interface OpenAI, la couche intermédiaire gère l'exécution et le routage des modèles, et la couche inférieure fournit les noyaux GPU de base. Cette conception intègre efficacement les technologies de « mixture-of-experts » (MoE) et de quantification, garantissant une prise en charge robuste pour les déploiements à grande échelle.
Large compatibilité avec les écosystèmes de calcul
Le plugin cible les GPU haute performance des séries Instinct MI350 et MI400 d'AMD. Il prend en charge non seulement les principaux modèles linguistiques chinois de grande envergure tels que Qwen3 et GLM, mais couvre également de manière exhaustive divers scénarios d'application, y compris les modèles denses, les modèles de type « mixture-of-experts » et les modèles vision-langage (VLM).
Article connexe
Google I/O 2026 dévoile l'interaction vocale avec la boîte de réception Gmail
Google continue d'intégrer l'IA à votre boîte de réception. Lors de la conférence des développeurs IO 2026 qui s'est tenue mardi, l'entreprise a enrichi sa fonctionnalité « AI Inbox » de Gmail d'une I
iFlytek lance ses lunettes intelligentes dotées de l’assistant GlassClaw pour 4299 yuans chinois.
À mesure que les grands modèles d'IA se déplacent de plus en plus vers le matériel périphérique, le marché des appareils portables intelligents voit arriver un nouveau joueur important. Le 28 mai, iFLYTEK a officiellement lancé ses « lunettes AI iFLY
Lei Jun confirme que l'agent IA de bureau de Xiaomi, MiClaw, est en cours de développement, tandis que MiMo-V2-Pro est lancé sur toutes les plateformes
Lors du Forum de haut niveau sur le développement de la Chine 2026, Lei Jun, du groupe Xiaomi, a confirmé que la version de bureau tant attendue de l'agent IA « MiClaw » (crabe) figurait désormais dan
Recommandations de sujets spéciaux liés
commentaires (0)
AMD a officiellement lancé le plugin vLLM-ATOM, spécialement conçu pour le déploiement de grands modèles linguistiques. Ce plugin vise à améliorer considérablement les performances d'inférence des grands modèles nationaux courants, tels que DeepSeek-R1 et Kimi-K2, sur le matériel AMD, sans perturber les flux de travail existants.
En tant que framework d'inférence open source conçu pour les scénarios à forte concurrence, vLLM est réputé pour son excellente efficacité mémoire. Le nouveau plugin d'AMD offre une solution d'optimisation plus personnalisée pour ses GPU de la série Instinct, permettant aux développeurs de réaliser une migration technique avec un effort d'apprentissage minimal.

Amélioration transparente des performances
Le principal avantage du plugin vLLM-ATOM réside dans son déploiement « sans coût ». Les utilisateurs n’ont pas besoin de modifier leurs API existantes ni leurs workflows de bout en bout. Le plugin gère et optimise automatiquement la planification des requêtes et le réglage du noyau en arrière-plan, permettant aux services actuels de migrer en douceur vers le backend matériel AMD.
Sur le plan architectural, le plugin est structuré en trois couches : la couche supérieure assure la compatibilité avec l'interface OpenAI, la couche intermédiaire gère l'exécution et le routage des modèles, et la couche inférieure fournit les noyaux GPU de base. Cette conception intègre efficacement les technologies de « mixture-of-experts » (MoE) et de quantification, garantissant une prise en charge robuste pour les déploiements à grande échelle.
Large compatibilité avec les écosystèmes de calcul
Le plugin cible les GPU haute performance des séries Instinct MI350 et MI400 d'AMD. Il prend en charge non seulement les principaux modèles linguistiques chinois de grande envergure tels que Qwen3 et GLM, mais couvre également de manière exhaustive divers scénarios d'application, y compris les modèles denses, les modèles de type « mixture-of-experts » et les modèles vision-langage (VLM).
Google I/O 2026 dévoile l'interaction vocale avec la boîte de réception Gmail
Google continue d'intégrer l'IA à votre boîte de réception. Lors de la conférence des développeurs IO 2026 qui s'est tenue mardi, l'entreprise a enrichi sa fonctionnalité « AI Inbox » de Gmail d'une I
iFlytek lance ses lunettes intelligentes dotées de l’assistant GlassClaw pour 4299 yuans chinois.
À mesure que les grands modèles d'IA se déplacent de plus en plus vers le matériel périphérique, le marché des appareils portables intelligents voit arriver un nouveau joueur important. Le 28 mai, iFLYTEK a officiellement lancé ses « lunettes AI iFLY
Lei Jun confirme que l'agent IA de bureau de Xiaomi, MiClaw, est en cours de développement, tandis que MiMo-V2-Pro est lancé sur toutes les plateformes
Lors du Forum de haut niveau sur le développement de la Chine 2026, Lei Jun, du groupe Xiaomi, a confirmé que la version de bureau tant attendue de l'agent IA « MiClaw » (crabe) figurait désormais dan











