OpenaiのAI転写ツールに代わる優れた代替品：幻覚の減少、より正確さ

家

ニュース

2025年4月14日

PatrickGarcia

139

OpenaiのAI転写ツールに代わる優れた代替品：幻覚の減少、より正確さ

html

OpenAIのWhisper、2022年にリリースされたAI駆動の音声認識および文字起こしツールは、頻繁に幻覚を生成したり、情報を捏造したりすることが発見され、重要な場面での害を引き起こす可能性について懸念が提起されています。

ミシガン大学の研究者は、彼がレビューした公開会議の音声文字起こしの80％に幻覚を発見しました。同様に、100時間のWhisper文字起こしを分析したエンジニアは、約半分に幻覚があると報告し、別の開発者は彼が作成したほぼすべての文字起こしで幻覚を見つけ、合計26,000件に及びました。

文字起こしにおける軽微なエラーは一般的ですが、専門家はWhisperの幻覚のレベルがAI文字起こしツールの中で前例のないものであると指摘しました。OpenAIは、Whisperがオープンソースのニューラルネットワークであり、英語の音声認識で人間に近い精度を達成していると主張しています。このツールは、インタビューの文字起こし、コンテンツの翻訳、ビデオ字幕の生成など、さまざまな業界で広く使用されています。

Whisperの広範な使用は、捏造されたテキスト、誤って帰属された引用、その他の誤情報のさまざまなプラットフォームでの拡散につながる可能性があり、元のコンテンツの性質によって影響が異なります。WhisperはChatGPTの一部のバージョンに統合されており、コールセンター、音声アシスタント、OracleやMicrosoftのクラウドプラットフォームで使用されており、HuggingFaceから先月420万回以上ダウンロードされました。

特に懸念されるのは、医療専門家によるWhisperベースのツールの使用増加で、患者の診察を文字起こしするために使用されています。APは、12人以上のエンジニア、研究者、開発者と話し、Whisperがしばしばフレーズや文全体を捏造し、時には人種的コメント、暴力的なレトリック、さらには想像上の医療治療を含むことを確認しました。

「誰も誤診を望んでいません」と、Institute for Advanced Studyの教授であるAlondra Nelsonは強調しました。

OpenAIは、Whisperを精度の欠陥が重大な問題を引き起こす可能性のある意思決定の場面などの高リスク領域で使用しないよう推奨していますが、ツールの宣伝された精度は、潜在的なリスクを見過ごしがちなさまざまな業界にとって魅力的です。

問題は長くて録音状態の悪い音声に限定されません。研究者は、短くてクリアな音声サンプルでも幻覚を発見しました。彼らは、これが何百万もの録音にわたって数万件の誤った文字起こしにつながる可能性があると推定しています。Gallaudet大学のTechnology Access Programのディレクターで自身も聾病者であるChristian Voglerは、聾病者や難聴者が「他のテキストの中に隠れた」これらの幻覚を見逃す可能性があると指摘しました。

これらの発見は、AI業界全体のより大きな問題を浮き彫りにしています。米国における包括的なAI規制の不在の中での、利益のための製品の市場への急ぎ出しです。これは、OpenAIの営利対非営利の地位をめぐる議論や、AIのリスクを軽視する最近のリーダーシップの声明の中で特に重要です。

OpenAIの広報担当者はAPに対し、同社は幻覚を減らすために継続的に取り組んでおり、研究者の発見を評価し、フィードバックをモデル更新に取り入れていると述べました。

その間、ジャーナリストに信頼されている信頼性の高いAI文字起こしツールであるOtter.aiを検討することをお勧めします。Otter.aiは最近、6つの新しい言語のサポートを追加しました。長年のユーザーは、新しいAI要約機能で幻覚された統計を報告しましたが、文字起こし自体にはエラーはありませんでした。Otter.aiは、特に重要なタスクにおいて、ユーザーが文字起こしの精度を確認および編集することを推奨しており、背景ノイズ、アクセント、会話の複雑さなどの要因により精度が異なる可能性があると指摘しています。

iPhoneユーザー向けには、Apple Intelligenceを搭載したiOS 18.1がAI駆動の通話録音と文字起こしを提供していますが、ZDNETの編集長Jason Hinerはこれを「まだ進行中の作業」と形容しています。

OpenAIは最近、2億5千万のChatGPT Plusユーザーにさらに多くのツールを提供する計画を発表しました。

Manus、ウェブスクレイピングのための100以上のエージェントを備えたAIツール「Wide Research」を発表中国のAIイノベーターであるManusは、コンシューマーとプロフェッショナルの両方に対応する先駆的なマルチエージェント・オーケストレーション・プラットフォームで注目を集めたが、従来のAI研究アプローチに挑戦する同社の技術の画期的なアプリケーションを発表した。AIを活用した研究の再考OpenAI、Google、xAIのような競合他社は、詳細なレポートを作成するために何時間も調査を行うことができる特別

LLMが指示を無視する理由と効果的な修正方法大規模言語モデルが指示をスキップする理由を理解する大規模言語モデル（LLM）は、会話インターフェースからコンテンツの自動生成やプログラミング支援に至るまで、高度なアプリケーションを可能にし、AIとの対話方法を一変させました。しかし、ユーザーはしばしばフラストレーションのたまる制限に遭遇します。これらのモデルは、特に複雑で長いプロンプトにおいて、特定の指示を見落とすことがあるのです。この不完全なタ

ペブル、法廷闘争の末に元のブランド名を取り戻すペブルの帰還：名前とすべてPebbleの愛好家たちは喜べるだろう - この愛すべきスマートウォッチ・ブランドはカムバックするだけでなく、その象徴的な名前を取り戻そうとしている。「私たちはPebbleの商標を取り戻すことに成功し、そのスムーズさには正直驚かされました」と、Core DevicesのCEOであるEric Migicovsky氏は同社のブログの更新で明かしている。これは、先に発表されたC

コメント (18)

0/200

提出する

DouglasScott

2025年8月15日 11:01:03 JST

This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄

PaulLewis

2025年8月6日 2:01:00 JST

This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊

FrankSanchez

2025年8月4日 15:48:52 JST

This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔

WalterWhite

2025年4月16日 12:50:21 JST

このツールは本当に助かる！AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね！😊

HaroldLopez

2025年4月16日 3:21:19 JST

이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊

JimmyGarcia

2025年4月16日 3:19:21 JST

Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊

トップニュース

Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します AIボイスクローン：音声変換を極めるための完全ガイド

もっと

特集