OpenaiのAI転写ツールに代わる優れた代替品:幻覚の減少、より正確さ

OpenaiのWhisperは、2022年にリリースされたAIを搭載した音声認識と転写ツールであり、幻覚を頻繁に生成したり、情報を作成したりすることがわかっており、重要な設定に危害を加える可能性について懸念を引き起こしています。ミシガン大学の研究者は、彼がレビューした公開会議からのオーディオ転写の80%で幻覚を発見しました。同様に、100時間のささやき転写を分析したエンジニアは、それらの約半分で幻覚を報告し、別の開発者が彼が作成したほぼすべてのトランスクリプトで合計26,000インスタンスを見つけました。転写の軽微なエラーは一般的ですが、専門家は、ささやきの幻覚のレベルはAI転写ツールの間で前例のないことに注目しています。 Openaiは、オープンソースのニューラルネットワークであるWhisperが、英語の音声認識において人間に近い精度を達成すると主張しています。インタビューの転写、コンテンツの翻訳、ビデオ字幕の生成など、業界全体で広く使用されています。ささやきの広範な使用は、製造されたテキストの拡散、誤った引用符、およびさまざまなプラットフォームでのその他の誤報につながる可能性があり、その影響は元のコンテンツの性質に基づいて異なります。 Whisperは、ChatGPTのいくつかのバージョンに統合され、コールセンター、音声アシスタント、OracleとMicrosoftのクラウドプラットフォームで使用され、先月Huggingfaceから420万回以上ダウンロードされました。特に懸念されるのは、患者の相談を転写するための医療専門家によるウィスパーベースのツールの使用の増加です。 APは、人種の解説、暴力的なレトリック、さらには想像上の医療さえなど、ささやきがしばしばフレーズや文章全体を作り上げていることを確認したことを確認した12を超えるエンジニア、研究者、および開発者と話をしました。 「誰も誤診を望んでいない」と、高度な研究研究所の教授であるアロンドラ・ネルソンは強調した。 Openaiは、精度の欠陥が重大な問題につながる可能性のある意思決定コンテキストのようなリスクの高いドメインでささやきを使用することに対してアドバイスしていますが、ツールの販売された精度は、運用を合理化しようとするさまざまな業界にとって魅力的であり、しばしば潜在的なリスクを見落とします。この問題は、記録されていないオーディオに限定されません。研究者は、要するに明確なオーディオサンプルでさえ幻覚を発見しました。彼らは、これが何百万もの録音にわたって何万もの誤った転写をもたらす可能性があると推定しています。 Gallaudet Universityのテクノロジーアクセスプログラムのディレクターであり、聴覚障害者自身であるChristian Voglerは、耳が聞こえない、または聴覚が困難な人は、これらの幻覚を「他のすべてのテキストの中に隠した」ことを逃す可能性があると指摘しました。これらの調査結果は、AI業界のより広範な問題を強調しています。特に米国に包括的なAI規制がない場合、利益のための市場製品へのラッシュです。これは、Openaiの営利目と非営利のステータスと、AIのリスクを軽視する最近のリーダーシップ声明に関する議論の中で特に関連しています。 Openaiのスポークスマンは、APに、同社は幻覚を減らし、研究者の発見を大切にし、モデルの更新にフィードバックを組み込んでいると語った。それまでの間、ジャーナリストが信頼している信頼できるAI転写ツールであるOtter.aiを考慮することをお勧めします。長年のユーザーは、新しいAI要約機能で幻覚統計を報告しましたが、転写自体にエラーは表示されませんでした。 Otter.aiは、特に重要なタスクのために、正確性のために転写をレビューおよび編集するようにアドバイスします。背景ノイズ、アクセント、会話の複雑さなどの要因により、精度は異なる場合があります。 iPhoneユーザーの場合、Apple IntelligenceのiOS 18.1はAIを搭載したコール録音と転写を提供するようになりましたが、ZDNETの編集長であるJason Hinerは、それを「まだ進行中の作業」と表現しています。 Openaiは最近、2億5,000万人のChatGPTとユーザーにより多くのツールを提供する計画を発表しました。
関連記事
AIコミック:創作の最前線を探る
コミック業界は、人工知能の統合により大きな変革を遂げています。AIが遠い夢だった時代は過ぎ去り、今ではコミッククリエイターが作品を強化するための実際のツールとなっています。この記事では、AIとコミックの刺激的かつ議論を呼ぶ融合を掘り下げ、この活気あるメディアの未来を形作るツール、技術、倫理的ジレンマを考察します。コミック創作におけるAIの台頭AIがコミックアートをどのように革命化しているか長年、コ
Viggle AI: AIモーションミキシングでビデオVFXを革新
Viggle AIでビデオエフェクトを革新Viggle AIは、ビデオエフェクトの世界を再構築し、最先端のビジュアル制作をこれまで以上に身近なものにしています。複雑な設定や高価なソフトウェアの時代は終わりました。Viggle AIがあれば、アイデアさえあれば、あとは簡単に実現できます。この革新的なツールは、派手なエフェクトを追加するだけでなく、キャラクターや動きをインテリジェントに融合させ、プロフ
オンデマンド印刷とAIアート:Etsyのためのステップごとのガイド
在庫管理や製品作りに悩まず、Eコマースを始めたいと考えていますか?オンデマンド印刷(POD)とAIアート生成を組み合わせれば、手間のかからないオンラインビジネスが実現可能です。このガイドでは、AIを使って目を引くデザインを作成し、Etsyストアを立ち上げ、PODビジネスを始める手順を紹介します。AIアートをオンデマンド印刷製品に活用する主なポイントAIアートジェネレーターを活用して、アーティストで
コメント (15)
0/200
RonaldLee
2025年4月15日 0:00:00 GMT
This tool is a lifesaver for anyone tired of Whisper's hallucinations! It's way more accurate and reliable. I used it for a critical meeting transcription and it nailed every detail. Only wish it was a bit faster, but accuracy over speed any day!
0
StevenNelson
2025年4月15日 0:00:00 GMT
このツールはWhisperの幻覚に悩まされている人には救世主です!精度が高く信頼性もあります。重要な会議の文字起こしに使ってみましたが、細部まで完璧でした。もう少し速ければ最高なのに、と思いますが、精度が最優先ですね!
0
StevenGonzalez
2025年4月15日 0:00:00 GMT
위스퍼의 환각에 지친 사람들에게 이 도구는 구세주입니다! 훨씬 정확하고 신뢰할 수 있어요. 중요한 회의 녹취에 사용해봤는데, 모든 세부 사항을 완벽하게 잡아냈어요. 조금 더 빨랐으면 좋겠지만, 정확성이 우선이죠!
0
AlbertThomas
2025年4月15日 0:00:00 GMT
Esta ferramenta é uma salvação para quem está cansado das alucinações do Whisper! É muito mais precisa e confiável. Usei para transcrever uma reunião importante e pegou todos os detalhes. Só queria que fosse um pouco mais rápida, mas precisão acima de tudo!
0
CharlesJohnson
2025年4月15日 0:00:00 GMT
Esta herramienta es un salvavidas para quienes están hartos de las alucinaciones de Whisper. Es mucho más precisa y confiable. La usé para transcribir una reunión importante y capturó todos los detalles. Ojalá fuera un poco más rápida, pero la precisión es lo primero.
0
JuanCarter
2025年4月14日 0:00:00 GMT
This alternative to OpenAI's Whisper is a lifesaver! Less hallucinations and more accuracy? Sign me up! It's perfect for my work, but the interface could use a bit of a facelift. 😅
0




This tool is a lifesaver for anyone tired of Whisper's hallucinations! It's way more accurate and reliable. I used it for a critical meeting transcription and it nailed every detail. Only wish it was a bit faster, but accuracy over speed any day!




このツールはWhisperの幻覚に悩まされている人には救世主です!精度が高く信頼性もあります。重要な会議の文字起こしに使ってみましたが、細部まで完璧でした。もう少し速ければ最高なのに、と思いますが、精度が最優先ですね!




위스퍼의 환각에 지친 사람들에게 이 도구는 구세주입니다! 훨씬 정확하고 신뢰할 수 있어요. 중요한 회의 녹취에 사용해봤는데, 모든 세부 사항을 완벽하게 잡아냈어요. 조금 더 빨랐으면 좋겠지만, 정확성이 우선이죠!




Esta ferramenta é uma salvação para quem está cansado das alucinações do Whisper! É muito mais precisa e confiável. Usei para transcrever uma reunião importante e pegou todos os detalhes. Só queria que fosse um pouco mais rápida, mas precisão acima de tudo!




Esta herramienta es un salvavidas para quienes están hartos de las alucinaciones de Whisper. Es mucho más precisa y confiable. La usé para transcribir una reunión importante y capturó todos los detalles. Ojalá fuera un poco más rápida, pero la precisión es lo primero.




This alternative to OpenAI's Whisper is a lifesaver! Less hallucinations and more accuracy? Sign me up! It's perfect for my work, but the interface could use a bit of a facelift. 😅












