OpenaiのAI転写ツールに代わる優れた代替品:幻覚の減少、より正確さ

htmlOpenAIのWhisper、2022年にリリースされたAI駆動の音声認識および文字起こしツールは、頻繁に幻覚を生成したり、情報を捏造したりすることが発見され、重要な場面での害を引き起こす可能性について懸念が提起されています。
ミシガン大学の研究者は、彼がレビューした公開会議の音声文字起こしの80%に幻覚を発見しました。同様に、100時間のWhisper文字起こしを分析したエンジニアは、約半分に幻覚があると報告し、別の開発者は彼が作成したほぼすべての文字起こしで幻覚を見つけ、合計26,000件に及びました。
文字起こしにおける軽微なエラーは一般的ですが、専門家はWhisperの幻覚のレベルがAI文字起こしツールの中で前例のないものであると指摘しました。OpenAIは、Whisperがオープンソースのニューラルネットワークであり、英語の音声認識で人間に近い精度を達成していると主張しています。このツールは、インタビューの文字起こし、コンテンツの翻訳、ビデオ字幕の生成など、さまざまな業界で広く使用されています。
Whisperの広範な使用は、捏造されたテキスト、誤って帰属された引用、その他の誤情報のさまざまなプラットフォームでの拡散につながる可能性があり、元のコンテンツの性質によって影響が異なります。WhisperはChatGPTの一部のバージョンに統合されており、コールセンター、音声アシスタント、OracleやMicrosoftのクラウドプラットフォームで使用されており、HuggingFaceから先月420万回以上ダウンロードされました。
特に懸念されるのは、医療専門家によるWhisperベースのツールの使用増加で、患者の診察を文字起こしするために使用されています。APは、12人以上のエンジニア、研究者、開発者と話し、Whisperがしばしばフレーズや文全体を捏造し、時には人種的コメント、暴力的なレトリック、さらには想像上の医療治療を含むことを確認しました。
「誰も誤診を望んでいません」と、Institute for Advanced Studyの教授であるAlondra Nelsonは強調しました。
OpenAIは、Whisperを精度の欠陥が重大な問題を引き起こす可能性のある意思決定の場面などの高リスク領域で使用しないよう推奨していますが、ツールの宣伝された精度は、潜在的なリスクを見過ごしがちなさまざまな業界にとって魅力的です。
問題は長くて録音状態の悪い音声に限定されません。研究者は、短くてクリアな音声サンプルでも幻覚を発見しました。彼らは、これが何百万もの録音にわたって数万件の誤った文字起こしにつながる可能性があると推定しています。Gallaudet大学のTechnology Access Programのディレクターで自身も聾病者であるChristian Voglerは、聾病者や難聴者が「他のテキストの中に隠れた」これらの幻覚を見逃す可能性があると指摘しました。
これらの発見は、AI業界全体のより大きな問題を浮き彫りにしています。米国における包括的なAI規制の不在の中での、利益のための製品の市場への急ぎ出しです。これは、OpenAIの営利対非営利の地位をめぐる議論や、AIのリスクを軽視する最近のリーダーシップの声明の中で特に重要です。
OpenAIの広報担当者はAPに対し、同社は幻覚を減らすために継続的に取り組んでおり、研究者の発見を評価し、フィードバックをモデル更新に取り入れていると述べました。
その間、ジャーナリストに信頼されている信頼性の高いAI文字起こしツールであるOtter.aiを検討することをお勧めします。Otter.aiは最近、6つの新しい言語のサポートを追加しました。長年のユーザーは、新しいAI要約機能で幻覚された統計を報告しましたが、文字起こし自体にはエラーはありませんでした。Otter.aiは、特に重要なタスクにおいて、ユーザーが文字起こしの精度を確認および編集することを推奨しており、背景ノイズ、アクセント、会話の複雑さなどの要因により精度が異なる可能性があると指摘しています。
iPhoneユーザー向けには、Apple Intelligenceを搭載したiOS 18.1がAI駆動の通話録音と文字起こしを提供していますが、ZDNETの編集長Jason Hinerはこれを「まだ進行中の作業」と形容しています。
OpenAIは最近、2億5千万のChatGPT Plusユーザーにさらに多くのツールを提供する計画を発表しました。
関連記事
GoogleフォトがAIを活用し、『クルーレス』の象徴的なクローゼットを再現
Googleフォトは水曜日、AIを活用した新機能を発表した。この機能により、まもなく自分の服の写真をデジタルクローゼットに変換できるようになり、新しいコーディネートを考えたり、バーチャルで試着したりできるようになる。このコンセプトは、映画『クルーレス』に登場するシェールの象徴的なバーチャルワードローブから明らかに着想を得たもので、彼女は何を着るか決める際に、数多くのコーディネートの中から自由に選ん
短編ドラマ『レッド・フルーツ』、AIを使って一般人の顔を盗用したとして非難される;公式な反応はない
現在、ショート動画業界では、AIに関連する権利侵害をめぐる論争が起きている。 Red Fruit Short Dramaが制作した『The Peach Hairpin』は、AIを用いて一般人の肖像を無断で流用する「顔の盗用」を行ったとして非難され、世間の懸念を呼んでいる。この問題は、あるSNSユーザーが自身の写真がAI生成コンテンツに無断で使用されたと主張したことをきっかけに始まった。比較データに
新しいETSI AIセキュリティ規格の概要
ETSI EN 304 223は、組織がガバナンス体制に組み込むべき人工知能に関する基本的なセキュリティ要件を定めています。企業が機械学習を中核的なワークフローに統合する中、この欧州規格はAIモデルおよびシステムを保護するための具体的な規定を定めています。これは、各国標準化機関によって正式に承認された、AIサイバーセキュリティに関する世界的に適用可能な初の欧州規格であり、国際市場におけるその信頼性
関連特集おすすめ
コメント (18)
0/500
This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄
This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊
This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔
이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊

OpenAIのWhisper、2022年にリリースされたAI駆動の音声認識および文字起こしツールは、頻繁に幻覚を生成したり、情報を捏造したりすることが発見され、重要な場面での害を引き起こす可能性について懸念が提起されています。
ミシガン大学の研究者は、彼がレビューした公開会議の音声文字起こしの80%に幻覚を発見しました。同様に、100時間のWhisper文字起こしを分析したエンジニアは、約半分に幻覚があると報告し、別の開発者は彼が作成したほぼすべての文字起こしで幻覚を見つけ、合計26,000件に及びました。
文字起こしにおける軽微なエラーは一般的ですが、専門家はWhisperの幻覚のレベルがAI文字起こしツールの中で前例のないものであると指摘しました。OpenAIは、Whisperがオープンソースのニューラルネットワークであり、英語の音声認識で人間に近い精度を達成していると主張しています。このツールは、インタビューの文字起こし、コンテンツの翻訳、ビデオ字幕の生成など、さまざまな業界で広く使用されています。
Whisperの広範な使用は、捏造されたテキスト、誤って帰属された引用、その他の誤情報のさまざまなプラットフォームでの拡散につながる可能性があり、元のコンテンツの性質によって影響が異なります。WhisperはChatGPTの一部のバージョンに統合されており、コールセンター、音声アシスタント、OracleやMicrosoftのクラウドプラットフォームで使用されており、HuggingFaceから先月420万回以上ダウンロードされました。
特に懸念されるのは、医療専門家によるWhisperベースのツールの使用増加で、患者の診察を文字起こしするために使用されています。APは、12人以上のエンジニア、研究者、開発者と話し、Whisperがしばしばフレーズや文全体を捏造し、時には人種的コメント、暴力的なレトリック、さらには想像上の医療治療を含むことを確認しました。
「誰も誤診を望んでいません」と、Institute for Advanced Studyの教授であるAlondra Nelsonは強調しました。
OpenAIは、Whisperを精度の欠陥が重大な問題を引き起こす可能性のある意思決定の場面などの高リスク領域で使用しないよう推奨していますが、ツールの宣伝された精度は、潜在的なリスクを見過ごしがちなさまざまな業界にとって魅力的です。
問題は長くて録音状態の悪い音声に限定されません。研究者は、短くてクリアな音声サンプルでも幻覚を発見しました。彼らは、これが何百万もの録音にわたって数万件の誤った文字起こしにつながる可能性があると推定しています。Gallaudet大学のTechnology Access Programのディレクターで自身も聾病者であるChristian Voglerは、聾病者や難聴者が「他のテキストの中に隠れた」これらの幻覚を見逃す可能性があると指摘しました。
これらの発見は、AI業界全体のより大きな問題を浮き彫りにしています。米国における包括的なAI規制の不在の中での、利益のための製品の市場への急ぎ出しです。これは、OpenAIの営利対非営利の地位をめぐる議論や、AIのリスクを軽視する最近のリーダーシップの声明の中で特に重要です。
OpenAIの広報担当者はAPに対し、同社は幻覚を減らすために継続的に取り組んでおり、研究者の発見を評価し、フィードバックをモデル更新に取り入れていると述べました。
その間、ジャーナリストに信頼されている信頼性の高いAI文字起こしツールであるOtter.aiを検討することをお勧めします。Otter.aiは最近、6つの新しい言語のサポートを追加しました。長年のユーザーは、新しいAI要約機能で幻覚された統計を報告しましたが、文字起こし自体にはエラーはありませんでした。Otter.aiは、特に重要なタスクにおいて、ユーザーが文字起こしの精度を確認および編集することを推奨しており、背景ノイズ、アクセント、会話の複雑さなどの要因により精度が異なる可能性があると指摘しています。
iPhoneユーザー向けには、Apple Intelligenceを搭載したiOS 18.1がAI駆動の通話録音と文字起こしを提供していますが、ZDNETの編集長Jason Hinerはこれを「まだ進行中の作業」と形容しています。
OpenAIは最近、2億5千万のChatGPT Plusユーザーにさらに多くのツールを提供する計画を発表しました。
GoogleフォトがAIを活用し、『クルーレス』の象徴的なクローゼットを再現
Googleフォトは水曜日、AIを活用した新機能を発表した。この機能により、まもなく自分の服の写真をデジタルクローゼットに変換できるようになり、新しいコーディネートを考えたり、バーチャルで試着したりできるようになる。このコンセプトは、映画『クルーレス』に登場するシェールの象徴的なバーチャルワードローブから明らかに着想を得たもので、彼女は何を着るか決める際に、数多くのコーディネートの中から自由に選ん
短編ドラマ『レッド・フルーツ』、AIを使って一般人の顔を盗用したとして非難される;公式な反応はない
現在、ショート動画業界では、AIに関連する権利侵害をめぐる論争が起きている。 Red Fruit Short Dramaが制作した『The Peach Hairpin』は、AIを用いて一般人の肖像を無断で流用する「顔の盗用」を行ったとして非難され、世間の懸念を呼んでいる。この問題は、あるSNSユーザーが自身の写真がAI生成コンテンツに無断で使用されたと主張したことをきっかけに始まった。比較データに
新しいETSI AIセキュリティ規格の概要
ETSI EN 304 223は、組織がガバナンス体制に組み込むべき人工知能に関する基本的なセキュリティ要件を定めています。企業が機械学習を中核的なワークフローに統合する中、この欧州規格はAIモデルおよびシステムを保護するための具体的な規定を定めています。これは、各国標準化機関によって正式に承認された、AIサイバーセキュリティに関する世界的に適用可能な初の欧州規格であり、国際市場におけるその信頼性
This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄
This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊
This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔
이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊





家






