Alternative supérieure à l'outil de transcription d'IA d'OpenAI: moins d'hallucination, plus de précision

Le chuchotement d'Openai, un outil de reconnaissance de la parole et de transcription propulsé par l'IA publié en 2022, s'est avéré générer fréquemment des hallucinations ou fabriquer des informations, ce qui soulève des préoccupations concernant son potentiel de dommage dans les milieux critiques. Un chercheur de l'Université du Michigan a découvert des hallucinations dans 80% des transcriptions audio des réunions publiques qu'il a examinées. De même, un ingénieur qui a analysé 100 heures de transcriptions Whisper a rapporté des hallucinations dans environ la moitié d'entre eux, et un autre développeur les a trouvés dans presque tous les transcrits qu'il a créés, totalisant 26 000 instances. Bien que les erreurs mineures de transcription soient courantes, les experts ont noté que le niveau d'hallucination de Whisper est sans précédent parmi les outils de transcription d'IA. Openai affirme que Whisper, un réseau neuronal open source, atteint une précision quasi humaine en reconnaissance de la parole anglaise. Il est largement utilisé dans toutes les industries pour des tâches telles que la transcription des interviews, la traduction du contenu et la génération de sous-titres vidéo. L'utilisation généralisée de chuchotement pourrait conduire à la propagation du texte fabriqué, des citations mal attribuées et d'autres informations sur diverses plates-formes, avec l'impact variant en fonction de la nature du contenu d'origine. Whisper est intégré dans certaines versions de Chatgpt, utilisées dans les centres d'appels, les assistants vocaux et les plates-formes cloud d'Oracle et Microsoft, et a été téléchargée plus de 4,2 millions de fois le mois dernier de HuggingFace. Une préoccupation particulière est l'utilisation croissante des outils basés sur des chuchotements par des professionnels de la santé pour transcrire des consultations pour les patients. L'AP a parlé avec plus d'une douzaine d'ingénieurs, de chercheurs et de développeurs qui ont confirmé que Whisper fabrique souvent des phrases et des phrases entières, y compris parfois des commentaires raciaux, une rhétorique violente et même des traitements médicaux imaginés. "Personne ne veut un diagnostic erroné", a souligné Alondra Nelson, professeur à l'Institut d'étude avancée. Bien que OpenAI conseille d'utiliser des chuchotements dans des domaines à haut risque comme des contextes de prise de décision où les défauts de précision peuvent entraîner des problèmes importants, la précision commercialisée de l'outil le rend attrayant pour diverses industries qui cherchent à rationaliser les opérations, négligeant souvent les risques potentiels. Le problème ne se limite pas à un audio long ou mal enregistré; Les chercheurs ont trouvé des hallucinations même dans des échantillons audio courts et clairs. Ils estiment que cela pourrait entraîner des dizaines de milliers de transcriptions incorrectes dans des millions d'enregistrements. Christian Vogler, directeur du programme d'accès technologique de l'Université Gallaudet et Deaf lui-même, a souligné que les personnes sourdes ou malentendantes peuvent manquer ces hallucinations "cachées parmi tous ces autres texte". Ces résultats mettent en évidence un problème plus large dans l'industrie de l'IA: la ruée vers le marché des produits à but lucratif, en particulier en l'absence de réglementations complètes de l'IA aux États-Unis. Ceci est particulièrement pertinent au milieu des débats sur le statut à but lucratif d'Openai et à but non lucratif et des déclarations de leadership récentes qui minimisent les risques d'IA. Un porte-parole d'OpenAI a déclaré à l'AP que l'entreprise s'efforçait de réduire les hallucinations et de valoriser les résultats des chercheurs, intégrant les commentaires dans les mises à jour du modèle. Dans l'intervalle, nous suggérons de considérer Otter.ai, un outil de transcription d'IA fiable qui a fait confiance aux journalistes, qui a récemment ajouté le soutien de six nouvelles langues. Alors qu'un utilisateur de longue date a signalé une statistique hallucinée dans une nouvelle fonction de résumé d'IA, l'erreur n'est pas apparue dans la transcription elle-même. Otter.ai conseille aux utilisateurs d'examiner et de modifier les transcriptions de précision, en particulier pour les tâches critiques, notant que la précision peut varier en raison de facteurs tels que le bruit de fond, les accents et la complexité de la conversation. Pour les utilisateurs d'iPhone, iOS 18.1 avec Apple Intelligence propose désormais l'enregistrement et la transcription des appels alimentés par AI, bien que le rédacteur en chef de ZDNET, Jason Hiner, le décrit comme "toujours un travail en cours". OpenAI a récemment annoncé son intention de fournir plus d'outils à ses 250 millions d'utilisateurs Chatgpt Plus.
Article connexe
Bandes dessinées IA : Explorer l'avant-garde de la création
L'industrie de la bande dessinée connaît une transformation majeure grâce à l'intégration de l'intelligence artificielle. Fini le temps où l'IA n'était qu'un rêve lointain ; elle est désormais un outi
Viggle AI : Révolutionner les effets vidéo avec le mélange de mouvements AI
Révolutionner les effets vidéo avec Viggle AIViggle AI redéfinit le monde des effets vidéo, rendant les créations visuelles de pointe plus accessibles que jamais. Fini le temps des configurations comp
Impression à la demande avec l'art IA : Guide étape par étape pour Etsy
Vous envisagez de vous lancer dans le commerce électronique mais redoutez la gestion des stocks ou la création de produits ? L'impression à la demande (POD) combinée à la génération d'art par IA pourr
commentaires (15)
0/200
RonaldLee
15 avril 2025 00:00:00 UTC
This tool is a lifesaver for anyone tired of Whisper's hallucinations! It's way more accurate and reliable. I used it for a critical meeting transcription and it nailed every detail. Only wish it was a bit faster, but accuracy over speed any day!
0
StevenNelson
15 avril 2025 00:00:00 UTC
このツールはWhisperの幻覚に悩まされている人には救世主です!精度が高く信頼性もあります。重要な会議の文字起こしに使ってみましたが、細部まで完璧でした。もう少し速ければ最高なのに、と思いますが、精度が最優先ですね!
0
StevenGonzalez
15 avril 2025 00:00:00 UTC
위스퍼의 환각에 지친 사람들에게 이 도구는 구세주입니다! 훨씬 정확하고 신뢰할 수 있어요. 중요한 회의 녹취에 사용해봤는데, 모든 세부 사항을 완벽하게 잡아냈어요. 조금 더 빨랐으면 좋겠지만, 정확성이 우선이죠!
0
AlbertThomas
15 avril 2025 00:00:00 UTC
Esta ferramenta é uma salvação para quem está cansado das alucinações do Whisper! É muito mais precisa e confiável. Usei para transcrever uma reunião importante e pegou todos os detalhes. Só queria que fosse um pouco mais rápida, mas precisão acima de tudo!
0
CharlesJohnson
15 avril 2025 00:00:00 UTC
Esta herramienta es un salvavidas para quienes están hartos de las alucinaciones de Whisper. Es mucho más precisa y confiable. La usé para transcribir una reunión importante y capturó todos los detalles. Ojalá fuera un poco más rápida, pero la precisión es lo primero.
0
JuanCarter
14 avril 2025 00:00:00 UTC
This alternative to OpenAI's Whisper is a lifesaver! Less hallucinations and more accuracy? Sign me up! It's perfect for my work, but the interface could use a bit of a facelift. 😅
0




This tool is a lifesaver for anyone tired of Whisper's hallucinations! It's way more accurate and reliable. I used it for a critical meeting transcription and it nailed every detail. Only wish it was a bit faster, but accuracy over speed any day!




このツールはWhisperの幻覚に悩まされている人には救世主です!精度が高く信頼性もあります。重要な会議の文字起こしに使ってみましたが、細部まで完璧でした。もう少し速ければ最高なのに、と思いますが、精度が最優先ですね!




위스퍼의 환각에 지친 사람들에게 이 도구는 구세주입니다! 훨씬 정확하고 신뢰할 수 있어요. 중요한 회의 녹취에 사용해봤는데, 모든 세부 사항을 완벽하게 잡아냈어요. 조금 더 빨랐으면 좋겠지만, 정확성이 우선이죠!




Esta ferramenta é uma salvação para quem está cansado das alucinações do Whisper! É muito mais precisa e confiável. Usei para transcrever uma reunião importante e pegou todos os detalhes. Só queria que fosse um pouco mais rápida, mas precisão acima de tudo!




Esta herramienta es un salvavidas para quienes están hartos de las alucinaciones de Whisper. Es mucho más precisa y confiable. La usé para transcribir una reunión importante y capturó todos los detalles. Ojalá fuera un poco más rápida, pero la precisión es lo primero.




This alternative to OpenAI's Whisper is a lifesaver! Less hallucinations and more accuracy? Sign me up! It's perfect for my work, but the interface could use a bit of a facelift. 😅












