Alternative supérieure à l'outil de transcription d'IA d'OpenAI: moins d'hallucination, plus de précision

Maison

Nouvelles

14 avril 2025

PatrickGarcia

218

Alternative supérieure à l'outil de transcription d'IA d'OpenAI: moins d'hallucination, plus de précision

Le Whisper d'OpenAI, un outil de reconnaissance et de transcription vocale alimenté par l'IA, lancé en 2022, génère fréquemment des hallucinations ou des informations fabriquées, suscitant des inquiétudes sur son potentiel de nuire dans des contextes critiques.

Un chercheur de l'Université du Michigan a découvert des hallucinations dans 80 % des transcriptions audio de réunions publiques qu'il a examinées. De même, un ingénieur ayant analysé 100 heures de transcriptions de Whisper a signalé des hallucinations dans environ la moitié d'entre elles, et un autre développeur en a trouvé dans presque toutes les transcriptions qu'il a créées, totalisant 26 000 cas.

Bien que des erreurs mineures dans la transcription soient courantes, les experts ont noté que le niveau d'hallucination de Whisper est sans précédent parmi les outils de transcription par IA. OpenAI affirme que Whisper, un réseau neuronal open-source, atteint une précision quasi humaine dans la reconnaissance vocale en anglais. Il est largement utilisé dans divers secteurs pour des tâches comme la transcription d'interviews, la traduction de contenu et la génération de sous-titres vidéo.

L'utilisation généralisée de Whisper pourrait entraîner la propagation de textes fabriqués, de citations erronées et d'autres désinformations sur diverses plateformes, l'impact variant selon la nature du contenu original. Whisper est intégré dans certaines versions de ChatGPT, utilisé dans les centres d'appels, les assistants vocaux et les plateformes cloud d'Oracle et Microsoft, et a été téléchargé plus de 4,2 millions de fois le mois dernier sur HuggingFace.

Une préoccupation particulière est l'utilisation croissante d'outils basés sur Whisper par les professionnels de la santé pour transcrire les consultations des patients. L'AP a interrogé plus d'une douzaine d'ingénieurs, de chercheurs et de développeurs qui ont confirmé que Whisper fabrique souvent des phrases et des phrases entières, parfois incluant des commentaires raciaux, des discours violents et même des traitements médicaux imaginaires.

"Personne ne veut un mauvais diagnostic," a souligné Alondra Nelson, professeure à l'Institute for Advanced Study.

Bien qu'OpenAI déconseille l'utilisation de Whisper dans des domaines à haut risque comme les contextes de prise de décision où des erreurs de précision peuvent entraîner des problèmes significatifs, la précision vantée de l'outil le rend attractif pour diverses industries cherchant à rationaliser leurs opérations, souvent en négligeant les risques potentiels.

Le problème ne se limite pas aux enregistrements audio longs ou mal enregistrés ; les chercheurs ont trouvé des hallucinations même dans des échantillons audio courts et clairs. Ils estiment que cela pourrait entraîner des dizaines de milliers de transcriptions erronées sur des millions d'enregistrements. Christian Vogler, directeur du Technology Access Program de l'Université Gallaudet et sourd lui-même, a souligné que les personnes sourdes ou malentendantes peuvent ne pas remarquer ces hallucinations "cachées parmi tout ce texte."

Ces découvertes mettent en lumière un problème plus large dans l'industrie de l'IA : la précipitation à commercialiser des produits pour le profit, surtout en l'absence de réglementations complètes sur l'IA aux États-Unis. Cela est particulièrement pertinent au milieu des débats sur le statut à but lucratif ou non lucratif d'OpenAI et des récentes déclarations de ses dirigeants qui minimisent les risques de l'IA.

Un porte-parole d'OpenAI a déclaré à l'AP que l'entreprise travaille continuellement à réduire les hallucinations et valorise les découvertes des chercheurs, intégrant leurs retours dans les mises à jour du modèle.

En attendant, nous suggérons d'envisager Otter.ai, un outil de transcription par IA fiable, apprécié des journalistes, qui a récemment ajouté le support pour six nouvelles langues. Bien qu'un utilisateur de longue date ait signalé une statistique hallucinée dans une nouvelle fonction de résumé par IA, l'erreur n'apparaissait pas dans la transcription elle-même. Otter.ai conseille aux utilisateurs de vérifier et de modifier les transcriptions pour en assurer l'exactitude, en particulier pour les tâches critiques, notant que la précision peut varier en raison de facteurs comme le bruit de fond, les accents et la complexité des conversations.

Pour les utilisateurs d'iPhone, iOS 18.1 avec Apple Intelligence propose désormais un enregistrement et une transcription d'appels alimentés par l'IA, bien que le rédacteur en chef de ZDNET, Jason Hiner, le décrive comme "encore en cours de développement."

OpenAI a récemment annoncé des plans pour fournir plus d'outils à ses 250 millions d'utilisateurs de ChatGPT Plus.

Article connexe

Google Photos redonne vie à la garde-robe emblématique de « Clueless » grâce à l'IA Google Photos a annoncé mercredi une nouvelle fonctionnalité basée sur l'IA qui permettra bientôt de transformer les photos de vos vêtements en une garde-robe numérique, vous permettant ainsi de créer

La série « Red Fruit » accusée d'utiliser l'IA pour voler les visages de personnes lambda ; aucune réaction officielle Le secteur des courtes vidéos fait actuellement l'objet d'une polémique liée à des violations impliquant l'IA. La production de Red Fruit Short Drama intitulée « The Peach Hairpin » a été accusée d’ut

Comprendre la nouvelle norme ETSI en matière de sécurité de l'IA La norme ETSI EN 304 223 définit les exigences fondamentales en matière de sécurité pour l'intelligence artificielle que les organisations doivent intégrer dans leurs structures de gouvernance.Alors q

Recommandations de sujets spéciaux liés

Productivité

Concepteurs d'architectures IA : concevez des architectures système évolutives à l'aide du langage naturel

Découvrez les meilleurs outils de conception d'architectures d'IA de 2026 sur XIX.AI. Notre sélection des outils les mieux notés propose des solutions puissantes et révolutionnaires pour créer des architectures système évolutives à l'aide du langage naturel. Comparez les options gratuites et payantes grâce à des avis concrets. Tirez pleinement parti de votre avantage en matière d'IA et optimisez votre développement dès aujourd'hui.

10 outils

xix.ai

Création de bande dessinée

Créateurs de profils de personnages AI : générer des histoires de fond détaillées et des références visuelles pour les personnages principaux des mangas

2026 : Les meilleurs outils pour créer des profils de personnages AI : Découvrez des outils hautement réputés qui vous permettent de générer des histoires détaillées et des références visuelles pour vos personnages principaux dans les mangas. Notre liste, mise à jour chaque semaine, compare les options gratuites et payantes sur la base d’essais réels. Trouvez des solutions puissantes qui transformeront votre processus créatif et vous aideront à créer des personnages captivants. Explorez le classement sur XIX.AI et découvrez dès aujourd’hui l’allié idéal pour votre narration.

10 outils

xix.ai

Santé et bien-être

Assistants IA pour la grossesse : créez des programmes d'entraînement et de nutrition sûrs, adaptés à chaque trimestre

Découvrez les meilleurs assistants de grossesse basés sur l'IA pour 2026, qui vous proposent des programmes d'entraînement et des plans nutritionnels personnalisés et sans risque, trimestre par trimestre. Bénéficiez de recommandations triées sur le volet et très bien notées, accompagnées de comparaisons entre les options gratuites et payantes ainsi que d'avis concrets. Vivez une grossesse en pleine forme grâce au guide d'experts de XIX.AI. Découvrez-le dès maintenant.

10 outils

xix.ai

en écrivant

Les meilleurs outils gratuits d'écriture IA indétectables : transformez des brouillons robotiques en textes naturels, dignes d'un humain

Découvrez les meilleurs générateurs de texte IA gratuits et indétectables de 2026 sur XIX.AI. Notre sélection rigoureuse des meilleurs outils vous aide à transformer des brouillons robotiques en textes naturels, dignes d'un humain. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Prenez dès aujourd'hui une longueur d'avance en matière de rédaction IA.

10 outils

xix.ai

Édition d'images

Generateurs d'art par intelligence artificielle pour storyboards de courts drames : personnages de fantasy et de romance urbaine

2026 : Découvrez les meilleurs générateurs d’art artificiel pour les storyboards de courts métrages. Notre liste sélectionnée présente des outils hautement réputés pour créer des personnages captivants dans les genres fantasy et romance urbaine. Comparez les options gratuites et payantes, consultez les résultats de tests réels et trouvez le partenaire créatif idéal pour vous. Recevez chaque semaine des classements mis à jour et des conseils d’experts de XIX.AI. Commencez dès aujourd’hui à visualiser votre histoire !

10 outils

xix.ai

en écrivant

Meilleurs outils d’scriptage AI pour la radio et la production de podcasts : rédiger des publicités audio captivantes

Découvrez les 20 meilleurs outils de scriptage AI pour la radio et la production de podcasts en 2026 sur XIX.AI. Notre liste, soigneusement sélectionnée et hautement réputée, propose des solutions puissantes et révolutionnaires pour créer rapidement des publicités audio captivantes. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mises à jour chaque semaine. Développez votre potentiel créatif dès aujourd’hui !

10 outils

xix.ai

commentaires (18)

0/500

Veuillez vous connecter d'abord

DouglasScott

15 août 2025 04:01:03 UTC+02:00

This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄

PaulLewis

5 août 2025 19:01:00 UTC+02:00

This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊

FrankSanchez

4 août 2025 08:48:52 UTC+02:00

This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔

WalterWhite

16 avril 2025 05:50:21 UTC+02:00

このツールは本当に助かる！AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね！😊

HaroldLopez

15 avril 2025 20:21:19 UTC+02:00

이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊

JimmyGarcia

15 avril 2025 20:19:21 UTC+02:00

Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊

Top nouvelles

AI Builder et Power Automate Révolutionnent la Synthèse de Documents Podcast Hosts Of NoteBookLM maintenant disponible pour les interviews La Chine dévoile ses normes nationales relatives aux robots humanoïdes et à l'intelligence incarnée L'adoption de l'IA par les entreprises plafonne, selon les données de Ramp Tutoriel Créateur d'Images Bing : Guide de Génération d'Art IA Apprenez à créer de la musique AI en utilisant votre voix: un tutoriel Suno étape par étape iMyFone MagicMic : Revue et tutoriel sur le changeur de voix AI en temps réel Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives Embodied Intelligence dévoile la première norme sectorielle visant à freiner la croissance anarchique DeepSeek V4 s'impose comme une technologie multimodale révolutionnaire dans le domaine de l'IA

Plus

En vedette