優越的替代方案是OpenAI的AI轉錄工具:較少的幻覺,更準確性

htmlOpenAI的Whisper,一款於2022年發布的AI驅動語音辨識與轉錄工具,被發現經常產生幻覺或捏造資訊,引發了對其在關鍵場景中可能造成危害的擔憂。
密西根大學的一位研究人員發現,在他審查的公開會議音頻轉錄中,80%存在幻覺。同樣,一位分析了100小時Whisper轉錄的工程師報告說,大約一半的轉錄中出現幻覺,另一位開發者則發現他創建的幾乎每個轉錄中都有幻覺,總計26,000個實例。
雖然轉錄中的小錯誤很常見,但專家指出,Whisper的幻覺程度在AI轉錄工具中是前所未有的。OpenAI聲稱,Whisper這一開源神經網絡在英語語音辨識中達到了接近人類的準確度。它被廣泛應用於各行業,用於轉錄採訪、翻譯內容和生成視頻字幕等任務。
Whisper的廣泛使用可能導致捏造文本、錯誤引用的語句和其他錯誤資訊在各平台上傳播,其影響因原始內容的性質而異。Whisper已整合進某些版本的ChatGPT,用於呼叫中心、語音助手以及Oracle和Microsoft的雲平台,僅上個月從HuggingFace的下载量就超過420萬次。
尤其令人擔憂的是,醫療專業人員越來越多地使用基於Whisper的工具來轉錄患者諮詢。美聯社與超過十二位工程師、研究人員和開發者交談,他們證實Whisper經常捏造短語和整句話,有時甚至包括種族評論、暴力言論,甚至是想像中的醫療治療。
「沒有人希望被誤診,」高級研究所的教授Alondra Nelson強調。
儘管OpenAI建議不要在高風險領域(如決策場景)中使用Whisper,因為準確性缺陷可能導致重大問題,但該工具宣傳的高準確性使其對希望簡化運營的各行業具有吸引力,常常忽略潛在風險。
問題不僅限於長或錄音質量差的音頻;研究人員發現,即使在短而清晰的音頻樣本中也存在幻覺。他們估計,這可能導致數百萬錄音中出現數萬個錯誤轉錄。Gallaudet大學技術訪問計劃主任Christian Vogler,他本身是聾病患者,指出聾病或聽力障礙人士可能無法察覺這些「隱藏在大量文本中的幻覺」。
這些發現突顯了AI行業的一個更廣泛問題:在美國缺乏全面AI監管的情況下,為了利潤而匆忙將產品推向市場。這一點在OpenAI的營利與非營利地位爭議以及近期領導層淡化AI風險的聲明中尤其相關。
OpenAI的發言人告訴美聯社,公司正在持續努力減少幻覺,並重視研究人員的發現,將反饋納入模型更新中。
與此同時,我們建議考慮使用Otter.ai,這是一款深受記者信賴的可靠AI轉錄工具,最近新增了對六種新語言的支持。雖然一位長期用戶報告說,在新的AI摘要功能中出現了一個幻覺統計數據,但該錯誤並未出現在轉錄本身中。Otter.ai建議用戶審查和編輯轉錄內容以確保準確性,特別是對於關鍵任務,指出準確性可能因背景噪音、口音和對話複雜性等因素而異。
對於iPhone用戶,搭載Apple Intelligence的iOS 18.1現在提供AI驅動的通話錄音和轉錄功能,儘管ZDNET的主編Jason Hiner形容其「仍在完善中」。
OpenAI最近宣布計劃為其2.5億ChatGPT Plus用戶提供更多工具。
相關文章
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結
OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區
相關專題推薦
評論 (18)
0/500
This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄
This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊
This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔
이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊

OpenAI的Whisper,一款於2022年發布的AI驅動語音辨識與轉錄工具,被發現經常產生幻覺或捏造資訊,引發了對其在關鍵場景中可能造成危害的擔憂。
密西根大學的一位研究人員發現,在他審查的公開會議音頻轉錄中,80%存在幻覺。同樣,一位分析了100小時Whisper轉錄的工程師報告說,大約一半的轉錄中出現幻覺,另一位開發者則發現他創建的幾乎每個轉錄中都有幻覺,總計26,000個實例。
雖然轉錄中的小錯誤很常見,但專家指出,Whisper的幻覺程度在AI轉錄工具中是前所未有的。OpenAI聲稱,Whisper這一開源神經網絡在英語語音辨識中達到了接近人類的準確度。它被廣泛應用於各行業,用於轉錄採訪、翻譯內容和生成視頻字幕等任務。
Whisper的廣泛使用可能導致捏造文本、錯誤引用的語句和其他錯誤資訊在各平台上傳播,其影響因原始內容的性質而異。Whisper已整合進某些版本的ChatGPT,用於呼叫中心、語音助手以及Oracle和Microsoft的雲平台,僅上個月從HuggingFace的下载量就超過420萬次。
尤其令人擔憂的是,醫療專業人員越來越多地使用基於Whisper的工具來轉錄患者諮詢。美聯社與超過十二位工程師、研究人員和開發者交談,他們證實Whisper經常捏造短語和整句話,有時甚至包括種族評論、暴力言論,甚至是想像中的醫療治療。
「沒有人希望被誤診,」高級研究所的教授Alondra Nelson強調。
儘管OpenAI建議不要在高風險領域(如決策場景)中使用Whisper,因為準確性缺陷可能導致重大問題,但該工具宣傳的高準確性使其對希望簡化運營的各行業具有吸引力,常常忽略潛在風險。
問題不僅限於長或錄音質量差的音頻;研究人員發現,即使在短而清晰的音頻樣本中也存在幻覺。他們估計,這可能導致數百萬錄音中出現數萬個錯誤轉錄。Gallaudet大學技術訪問計劃主任Christian Vogler,他本身是聾病患者,指出聾病或聽力障礙人士可能無法察覺這些「隱藏在大量文本中的幻覺」。
這些發現突顯了AI行業的一個更廣泛問題:在美國缺乏全面AI監管的情況下,為了利潤而匆忙將產品推向市場。這一點在OpenAI的營利與非營利地位爭議以及近期領導層淡化AI風險的聲明中尤其相關。
OpenAI的發言人告訴美聯社,公司正在持續努力減少幻覺,並重視研究人員的發現,將反饋納入模型更新中。
與此同時,我們建議考慮使用Otter.ai,這是一款深受記者信賴的可靠AI轉錄工具,最近新增了對六種新語言的支持。雖然一位長期用戶報告說,在新的AI摘要功能中出現了一個幻覺統計數據,但該錯誤並未出現在轉錄本身中。Otter.ai建議用戶審查和編輯轉錄內容以確保準確性,特別是對於關鍵任務,指出準確性可能因背景噪音、口音和對話複雜性等因素而異。
對於iPhone用戶,搭載Apple Intelligence的iOS 18.1現在提供AI驅動的通話錄音和轉錄功能,儘管ZDNET的主編Jason Hiner形容其「仍在完善中」。
OpenAI最近宣布計劃為其2.5億ChatGPT Plus用戶提供更多工具。
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結
OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區
This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄
This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊
This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔
이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊





首頁






