option
Maison
Nouvelles
Alternative supérieure à l'outil de transcription d'IA d'OpenAI: moins d'hallucination, plus de précision

Alternative supérieure à l'outil de transcription d'IA d'OpenAI: moins d'hallucination, plus de précision

14 avril 2025
125

Alternative supérieure à l'outil de transcription d'IA d'OpenAI: moins d'hallucination, plus de précision

Le Whisper d'OpenAI, un outil de reconnaissance et de transcription vocale alimenté par l'IA, lancé en 2022, génère fréquemment des hallucinations ou des informations fabriquées, suscitant des inquiétudes sur son potentiel de nuire dans des contextes critiques.

Un chercheur de l'Université du Michigan a découvert des hallucinations dans 80 % des transcriptions audio de réunions publiques qu'il a examinées. De même, un ingénieur ayant analysé 100 heures de transcriptions de Whisper a signalé des hallucinations dans environ la moitié d'entre elles, et un autre développeur en a trouvé dans presque toutes les transcriptions qu'il a créées, totalisant 26 000 cas.

Bien que des erreurs mineures dans la transcription soient courantes, les experts ont noté que le niveau d'hallucination de Whisper est sans précédent parmi les outils de transcription par IA. OpenAI affirme que Whisper, un réseau neuronal open-source, atteint une précision quasi humaine dans la reconnaissance vocale en anglais. Il est largement utilisé dans divers secteurs pour des tâches comme la transcription d'interviews, la traduction de contenu et la génération de sous-titres vidéo.

L'utilisation généralisée de Whisper pourrait entraîner la propagation de textes fabriqués, de citations erronées et d'autres désinformations sur diverses plateformes, l'impact variant selon la nature du contenu original. Whisper est intégré dans certaines versions de ChatGPT, utilisé dans les centres d'appels, les assistants vocaux et les plateformes cloud d'Oracle et Microsoft, et a été téléchargé plus de 4,2 millions de fois le mois dernier sur HuggingFace.

Une préoccupation particulière est l'utilisation croissante d'outils basés sur Whisper par les professionnels de la santé pour transcrire les consultations des patients. L'AP a interrogé plus d'une douzaine d'ingénieurs, de chercheurs et de développeurs qui ont confirmé que Whisper fabrique souvent des phrases et des phrases entières, parfois incluant des commentaires raciaux, des discours violents et même des traitements médicaux imaginaires.

"Personne ne veut un mauvais diagnostic," a souligné Alondra Nelson, professeure à l'Institute for Advanced Study.

Bien qu'OpenAI déconseille l'utilisation de Whisper dans des domaines à haut risque comme les contextes de prise de décision où des erreurs de précision peuvent entraîner des problèmes significatifs, la précision vantée de l'outil le rend attractif pour diverses industries cherchant à rationaliser leurs opérations, souvent en négligeant les risques potentiels.

Le problème ne se limite pas aux enregistrements audio longs ou mal enregistrés ; les chercheurs ont trouvé des hallucinations même dans des échantillons audio courts et clairs. Ils estiment que cela pourrait entraîner des dizaines de milliers de transcriptions erronées sur des millions d'enregistrements. Christian Vogler, directeur du Technology Access Program de l'Université Gallaudet et sourd lui-même, a souligné que les personnes sourdes ou malentendantes peuvent ne pas remarquer ces hallucinations "cachées parmi tout ce texte."

Ces découvertes mettent en lumière un problème plus large dans l'industrie de l'IA : la précipitation à commercialiser des produits pour le profit, surtout en l'absence de réglementations complètes sur l'IA aux États-Unis. Cela est particulièrement pertinent au milieu des débats sur le statut à but lucratif ou non lucratif d'OpenAI et des récentes déclarations de ses dirigeants qui minimisent les risques de l'IA.

Un porte-parole d'OpenAI a déclaré à l'AP que l'entreprise travaille continuellement à réduire les hallucinations et valorise les découvertes des chercheurs, intégrant leurs retours dans les mises à jour du modèle.

En attendant, nous suggérons d'envisager Otter.ai, un outil de transcription par IA fiable, apprécié des journalistes, qui a récemment ajouté le support pour six nouvelles langues. Bien qu'un utilisateur de longue date ait signalé une statistique hallucinée dans une nouvelle fonction de résumé par IA, l'erreur n'apparaissait pas dans la transcription elle-même. Otter.ai conseille aux utilisateurs de vérifier et de modifier les transcriptions pour en assurer l'exactitude, en particulier pour les tâches critiques, notant que la précision peut varier en raison de facteurs comme le bruit de fond, les accents et la complexité des conversations.

Pour les utilisateurs d'iPhone, iOS 18.1 avec Apple Intelligence propose désormais un enregistrement et une transcription d'appels alimentés par l'IA, bien que le rédacteur en chef de ZDNET, Jason Hiner, le décrive comme "encore en cours de développement."

OpenAI a récemment annoncé des plans pour fournir plus d'outils à ses 250 millions d'utilisateurs de ChatGPT Plus.

Article connexe
Explorer la dévotion divine : Foi, amour et liberté spirituelle Explorer la dévotion divine : Foi, amour et liberté spirituelle Dans un monde rempli de chaos et de distractions, créer des moments de paix pour une connexion spirituelle peut transformer des vies. Cet article explore l'acte profond de vénérer Jésus, en abordant l
Gestion SQL alimentée par l'IA : Simplifier les bases de données en 2025 Gestion SQL alimentée par l'IA : Simplifier les bases de données en 2025 L'intelligence artificielle transforme la gestion des bases de données avec SQL, en introduisant des outils innovants qui améliorent l'automatisation et l'efficacité. En comprenant les contextes des d
De Dot-Com à l'IA : Leçons pour éviter les écueils technologiques passés De Dot-Com à l'IA : Leçons pour éviter les écueils technologiques passés Pendant le boom des dot-com, ajouter « .com » au nom d'une entreprise pouvait faire grimper son cours boursier, même sans clients, revenus ou modèle économique viable. Aujourd'hui, la même frénésie en
commentaires (17)
0/200
PaulLewis
PaulLewis 5 août 2025 19:01:00 UTC+02:00

This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊

FrankSanchez
FrankSanchez 4 août 2025 08:48:52 UTC+02:00

This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔

WalterWhite
WalterWhite 16 avril 2025 05:50:21 UTC+02:00

このツールは本当に助かる!AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね!😊

HaroldLopez
HaroldLopez 15 avril 2025 20:21:19 UTC+02:00

이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊

JimmyGarcia
JimmyGarcia 15 avril 2025 20:19:21 UTC+02:00

Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊

RogerJackson
RogerJackson 15 avril 2025 16:28:05 UTC+02:00

OpenAI의 Whisper 대체 도구는 정말 구세주네요! 환각이 적고 정확도가 높다니, 가입해야죠! 일에는 완벽하지만 인터페이스가 좀 더 세련되면 좋겠어요. 😅

Retour en haut
OR