Mistral dévoile Voxtral, un modèle d'IA audio révolutionnaire à code source ouvert
Alors que les systèmes d'IA deviennent de plus en plus sophistiqués, la parole s'impose rapidement comme le principal moyen d'interaction avec les machines. La startup française Mistral, spécialisée dans l'IA, est entrée dans l'arène audio avec son premier modèle ouvert, remettant en cause la domination des systèmes fermés des entreprises en proposant des alternatives à poids ouvert.
Mardi, Mistral a présenté Voxtral, sa première famille de modèles audio conçus pour un usage professionnel.
La société présente Voxtral comme le premier modèle ouvert capable de fournir une "intelligence vocale réellement utilisable en production".
Cela signifie que les développeurs n'ont plus à choisir entre un système ouvert abordable mais imprécis, qui se heurte à des difficultés de transcription et manque de compréhension réelle, et un système fonctionnel mais fermé, qui s'accompagne de coûts plus élevés et d'un contrôle de déploiement limité.
Pour les entreprises, Voxtral représente une alternative rentable qui, selon Mistral, est "moins de la moitié du prix" de solutions comparables.

Crédits d'image : Mistral Mistral affirme que Voxtral peut transcrire jusqu'à 30 minutes d'audio. Grâce à sa colonne vertébrale LLM, Mistral Small 3.1, il comprend jusqu'à 40 minutes, ce qui permet aux utilisateurs de poser des questions sur l'audio, de générer des résumés ou de convertir des commandes vocales en actions en temps réel telles que des appels API ou l'exécution de fonctions. Voxtral est multilingue, capable de transcrire et de comprendre des langues telles que l'anglais, l'espagnol, le français, le portugais, l'hindi, l'allemand, le néerlandais et l'italien.
La société lance deux variantes de ses "modèles de compréhension de la parole". La première, Voxtral Small, comporte 24B paramètres pour les déploiements à l'échelle de la production et est en concurrence avec ElevenLabs Scribe, GPT-4o-mini et Gemini 2.5 Flash.
Événement Techcrunch EN DIRECT ! TechCrunch All Stage
Construisez plus intelligemment. Développez plus rapidement. Connectez-vous plus profondément. Rejoignez les dirigeants de Precursor Ventures, NEA, Index Ventures, Underscore VC, et bien d'autres pour une journée remplie de stratégies, d'ateliers et de précieux réseaux.
Économisez 450 $ sur votre laissez-passer TechCrunch All Stage
Construisez plus intelligemment. Développez plus rapidement. Connectez-vous plus profondément. Rejoignez les leaders de Precursor Ventures, NEA, Index Ventures, Underscore VC, et plus encore pour une journée remplie de stratégies, d'ateliers et de réseaux précieux.
Boston, MA | 15 juillet INSCRIVEZ-VOUS DÈS MAINTENANT Le second, Voxtral Mini, dispose de 3 milliards de paramètres pour les déploiements locaux et périphériques. Il existe également une version API ultra-abordable, rationalisée et rapide du modèle 3B appelée Voxtral Mini Transcribe, optimisée uniquement pour les tâches de transcription et conçue pour surpasser OpenAI Whisper à moins de la moitié du coût.
Les utilisateurs peuvent tester Voxtral gratuitement en téléchargeant l'API à partir de Hugging Face ou en essayant les modèles dans le chatbot Le Chat de Mistral. L'intégration de l'API pour les applications commence à 0,001 $ par minute, selon la société.
Cette version fait suite à l'annonce par Mistral de Magistral le mois dernier, sa première famille de modèles de raisonnement qui résolvent les problèmes étape par étape pour une fiabilité accrue.
Mistral, l'une des principales entreprises d'IA en Europe, est réputée pour sa défense des modèles d'IA à code source ouvert. Au début du mois, TechCrunch a rapporté que l'entreprise négociait pour lever jusqu'à 1 milliard de dollars de fonds propres auprès d'investisseurs tels que le fonds MGX d'Abu Dhabi.
Article connexe
WordPress.com permet désormais à des agents IA de rédiger et de publier des articles, et bien plus encore
WordPress.com, la célèbre plateforme d'hébergement et de publication Web, se tourne désormais vers les agents IA, une initiative qui pourrait bien redéfinir l'apparence et l'ergonomie du Web. La socié
Kakao Mobility présente sa feuille de route pour la conduite autonome de niveau 4 basée sur l'IA physique
Kakao Mobility prévoit de développer en interne des technologies de conduite autonome de niveau 4 dans le cadre de sa stratégie d'IA physique.Lors de la conférence World IT Show 2026 qui s'est tenue
Barry Diller : la confiance en Sam Altman n'a plus d'importance à l'approche de l'IA générale
Barry Diller, le magnat milliardaire des médias, ne considère pas que Sam Altman, PDG d’OpenAI, soit indigne de confiance, malgré des informations récentes suggérant le contraire. S’exprimant cette se
Recommandations de sujets spéciaux liés
commentaires (0)
Alors que les systèmes d'IA deviennent de plus en plus sophistiqués, la parole s'impose rapidement comme le principal moyen d'interaction avec les machines. La startup française Mistral, spécialisée dans l'IA, est entrée dans l'arène audio avec son premier modèle ouvert, remettant en cause la domination des systèmes fermés des entreprises en proposant des alternatives à poids ouvert.
Mardi, Mistral a présenté Voxtral, sa première famille de modèles audio conçus pour un usage professionnel.
La société présente Voxtral comme le premier modèle ouvert capable de fournir une "intelligence vocale réellement utilisable en production".
Cela signifie que les développeurs n'ont plus à choisir entre un système ouvert abordable mais imprécis, qui se heurte à des difficultés de transcription et manque de compréhension réelle, et un système fonctionnel mais fermé, qui s'accompagne de coûts plus élevés et d'un contrôle de déploiement limité.
Pour les entreprises, Voxtral représente une alternative rentable qui, selon Mistral, est "moins de la moitié du prix" de solutions comparables.

Mistral affirme que Voxtral peut transcrire jusqu'à 30 minutes d'audio. Grâce à sa colonne vertébrale LLM, Mistral Small 3.1, il comprend jusqu'à 40 minutes, ce qui permet aux utilisateurs de poser des questions sur l'audio, de générer des résumés ou de convertir des commandes vocales en actions en temps réel telles que des appels API ou l'exécution de fonctions. Voxtral est multilingue, capable de transcrire et de comprendre des langues telles que l'anglais, l'espagnol, le français, le portugais, l'hindi, l'allemand, le néerlandais et l'italien.
La société lance deux variantes de ses "modèles de compréhension de la parole". La première, Voxtral Small, comporte 24B paramètres pour les déploiements à l'échelle de la production et est en concurrence avec ElevenLabs Scribe, GPT-4o-mini et Gemini 2.5 Flash.
Événement TechcrunchEN DIRECT ! TechCrunch All Stage
Construisez plus intelligemment. Développez plus rapidement. Connectez-vous plus profondément. Rejoignez les dirigeants de Precursor Ventures, NEA, Index Ventures, Underscore VC, et bien d'autres pour une journée remplie de stratégies, d'ateliers et de précieux réseaux.
Économisez 450 $ sur votre laissez-passer TechCrunch All Stage
Construisez plus intelligemment. Développez plus rapidement. Connectez-vous plus profondément. Rejoignez les leaders de Precursor Ventures, NEA, Index Ventures, Underscore VC, et plus encore pour une journée remplie de stratégies, d'ateliers et de réseaux précieux.
Boston, MA | 15 juillet INSCRIVEZ-VOUS DÈS MAINTENANTLe second, Voxtral Mini, dispose de 3 milliards de paramètres pour les déploiements locaux et périphériques. Il existe également une version API ultra-abordable, rationalisée et rapide du modèle 3B appelée Voxtral Mini Transcribe, optimisée uniquement pour les tâches de transcription et conçue pour surpasser OpenAI Whisper à moins de la moitié du coût.
Les utilisateurs peuvent tester Voxtral gratuitement en téléchargeant l'API à partir de Hugging Face ou en essayant les modèles dans le chatbot Le Chat de Mistral. L'intégration de l'API pour les applications commence à 0,001 $ par minute, selon la société.
Cette version fait suite à l'annonce par Mistral de Magistral le mois dernier, sa première famille de modèles de raisonnement qui résolvent les problèmes étape par étape pour une fiabilité accrue.
Mistral, l'une des principales entreprises d'IA en Europe, est réputée pour sa défense des modèles d'IA à code source ouvert. Au début du mois, TechCrunch a rapporté que l'entreprise négociait pour lever jusqu'à 1 milliard de dollars de fonds propres auprès d'investisseurs tels que le fonds MGX d'Abu Dhabi.
WordPress.com permet désormais à des agents IA de rédiger et de publier des articles, et bien plus encore
WordPress.com, la célèbre plateforme d'hébergement et de publication Web, se tourne désormais vers les agents IA, une initiative qui pourrait bien redéfinir l'apparence et l'ergonomie du Web. La socié
Barry Diller : la confiance en Sam Altman n'a plus d'importance à l'approche de l'IA générale
Barry Diller, le magnat milliardaire des médias, ne considère pas que Sam Altman, PDG d’OpenAI, soit indigne de confiance, malgré des informations récentes suggérant le contraire. S’exprimant cette se





Maison






