Überlegene Alternative zu OpenAs KI -Transkriptionsinstrument: Weniger Halluzination, mehr Genauigkeit

Heim

Nachricht

14. April 2025

PatrickGarcia

139

Überlegene Alternative zu OpenAs KI -Transkriptionsinstrument: Weniger Halluzination, mehr Genauigkeit

Whisper von OpenAI, ein KI-gestütztes Spracherkennungs- und Transkriptionstool, das 2022 veröffentlicht wurde, erzeugt häufig Halluzinationen oder erfundene Informationen, was Bedenken hinsichtlich seines Potenzials zur Schadensverursachung in kritischen Bereichen aufwirft.

Ein Forscher an der University of Michigan entdeckte Halluzinationen in 80 % der Audiodatei-Transkripte von öffentlichen Sitzungen, die er überprüfte. Ebenso berichtete ein Ingenieur, der 100 Stunden Whisper-Transkripte analysierte, von Halluzinationen in etwa der Hälfte davon, und ein weiterer Entwickler fand sie in fast jedem von ihm erstellten Transkript, insgesamt 26.000 Fälle.

Während kleinere Fehler in der Transkription häufig sind, stellten Experten fest, dass das Ausmaß der Halluzinationen bei Whisper unter KI-Transkriptionstools beispiellos ist. OpenAI behauptet, dass Whisper, ein Open-Source-Neuralnetzwerk, eine nahezu menschliche Genauigkeit bei der englischen Spracherkennung erreicht. Es wird in verschiedenen Branchen für Aufgaben wie das Transkribieren von Interviews, das Übersetzen von Inhalten und das Erstellen von Video-Untertiteln weit verbreitet eingesetzt.

Die weitverbreitete Nutzung von Whisper könnte zur Verbreitung erfundener Texte, falsch zugeordneter Zitate und anderer Fehlinformationen über verschiedene Plattformen führen, wobei die Auswirkungen je nach Art des ursprünglichen Inhalts variieren. Whisper ist in einige Versionen von ChatGPT integriert, wird in Callcentern, Sprachassistenten und Cloud-Plattformen von Oracle und Microsoft verwendet und wurde letzten Monat über 4,2 Millionen Mal von HuggingFace heruntergeladen.

Besonders besorgniserregend ist die zunehmende Nutzung von Whisper-basierten Tools durch Mediziner zur Transkription von Patientengesprächen. Die AP sprach mit über einem Dutzend Ingenieuren, Forschern und Entwicklern, die bestätigten, dass Whisper häufig Phrasen und ganze Sätze erfindet, manchmal einschließlich rassistischer Kommentare, gewalttätiger Rhetorik und sogar erfundener medizinischer Behandlungen.

„Niemand will eine Fehldiagnose“, betonte Alondra Nelson, Professorin am Institute for Advanced Study.

Obwohl OpenAI davon abrät, Whisper in risikoreichen Bereichen wie Entscheidungskontexten einzusetzen, in denen Genauigkeitsfehler zu erheblichen Problemen führen können, macht die beworbene Genauigkeit des Tools es für verschiedene Branchen attraktiv, die ihre Abläufe optimieren wollen, wobei potenzielle Risiken oft übersehen werden.

Das Problem beschränkt sich nicht auf lange oder schlecht aufgezeichnete Audiodateien; Forscher fanden Halluzinationen sogar in kurzen, klaren Audioaufnahmen. Sie schätzen, dass dies zu Zehntausenden fehlerhafter Transkripte bei Millionen von Aufnahmen führen könnte. Christian Vogler, Direktor des Technology Access Program der Gallaudet University und selbst taub, wies darauf hin, dass taube oder schwerhörige Personen diese Halluzinationen „verborgen inmitten all dieses anderen Textes“ übersehen könnten.

Diese Erkenntnisse beleuchten ein breiteres Problem in der KI-Branche: den Wettlauf, Produkte aus Profitgründen auf den Markt zu bringen, insbesondere in Abwesenheit umfassender KI-Regulierungen in den USA. Dies ist besonders relevant angesichts der Debatten über den gewinnorientierten vs. gemeinnützigen Status von OpenAI und kürzlicher Führungsstatements, die KI-Risiken herunterspielen.

Ein Sprecher von OpenAI teilte der AP mit, dass das Unternehmen kontinuierlich daran arbeitet, Halluzinationen zu reduzieren, und die Erkenntnisse der Forscher schätzt, indem es Feedback in Modell-Updates einfließt.

In der Zwischenzeit empfehlen wir, Otter.ai in Betracht zu ziehen, ein zuverlässiges KI-Transkriptionstool, das von Journalisten geschätzt wird und kürzlich Unterstützung für sechs neue Sprachen hinzugefügt hat. Ein langjähriger Nutzer berichtete von einer halluzinierten Statistik in einer neuen KI-Zusammenfassungsfunktion, der Fehler erschien jedoch nicht in der Transkription selbst. Otter.ai empfiehlt Nutzern, Transkripte auf Genauigkeit zu überprüfen und zu bearbeiten, insbesondere für kritische Aufgaben, da die Genauigkeit aufgrund von Faktoren wie Hintergrundgeräuschen, Akzenten und der Komplexität von Gesprächen variieren kann.

Für iPhone-Nutzer bietet iOS 18.1 mit Apple Intelligence jetzt KI-gestützte Anrufaufzeichnung und Transkription, obwohl Jason Hiner, Chefredakteur von ZDNET, es als „noch in Arbeit“ beschreibt.

OpenAI kündigte kürzlich Pläne an, seinen 250 Millionen ChatGPT Plus-Nutzern weitere Tools bereitzustellen.

Verwandter Artikel

Midjourney stellt hochmodernen AI-Video-Generator für kreative Inhalte vor Midjourne's Durchbruch bei der KI-VideoerzeugungMidjourney hat sein erstes Tool zur Erzeugung von KI-Videos vorgestellt und damit seine bekannten Fähigkeiten zur Bilderstellung deutlich erweitert. Die

Google stoppt Pixel 10-Leaks durch frühzeitige offizielle Enthüllung des Smartphones Google lockt seine Fans mit einem frühen Blick auf das kommende Pixel 10-Smartphone und zeigt das offizielle Design nur wenige Wochen vor dem geplanten Launch-Event am 20. August.Ein Werbevideo auf de

Googles Gemini-App mit Echtzeit-KI-Video, Deep Research und neuen Funktionen (120 Zeichen) Google hat auf seiner Entwicklerkonferenz I/O 2025 wichtige Verbesserungen für Gemini AI vorgestellt. Dabei wurden die multimodalen Funktionen erweitert, KI-Modelle der nächsten Generation eingeführt

Kommentare (18)

0/200

Einreichen

DouglasScott

15. August 2025 04:01:03 MESZ

This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄

PaulLewis

5. August 2025 19:01:00 MESZ

This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊

FrankSanchez

4. August 2025 08:48:52 MESZ

This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔

WalterWhite

16. April 2025 05:50:21 MESZ

このツールは本当に助かる！AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね！😊

HaroldLopez

15. April 2025 20:21:19 MESZ

이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊

JimmyGarcia

15. April 2025 20:19:21 MESZ

Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊

Top -Nachrichten

Gemini 2.5 Pro jetzt unbegrenzt und billiger als Claude, GPT-4O Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen AI-Synchronisation: Ultimativer Leitfaden zur realistischen Stimmen-Erstellung Die KI von Cambium verwandelt Abfall Holz in Holz OpenAI verbessert den AI -Sprachassistenten für bessere Chats So stellen Sie sicher, dass Ihre Daten für die KI -Integration vertrauenswürdig sind NotebookLM erweitert weltweit, fügt Folien und eine verbesserte Faktenprüfung hinzu Optimierungen an US -Rechenzentren könnten 76 GW neue Leistungskapazität freischalten Google nutzt KI, um über 39 Millionen Anzeigenkonten für mutmaßlichen Betrug auszusetzen Künstliche Intelligenz Sprachklonierung: Das ultimative Handbuch zur Beherrschung der Sprachkonvertierung

Mehr

Vorgestellt