优越的替代方案是OpenAI的AI转录工具:较少的幻觉,更准确性

OpenAI的Whisper,一种于2022年发布的AI驱动的语音识别和转录工具,被发现经常产生幻觉或编造信息,引发对其在关键场景中可能造成危害的担忧。
密歇根大学的一位研究人员发现,他审查的公共会议音频转录中有80%存在幻觉。同样,一位分析了100小时Whisper转录的工程师报告称,其中约一半存在幻觉,另一位开发者发现他创建的几乎每个转录中都有幻觉,总计26,000次。
虽然转录中的小错误很常见,但专家指出,Whisper的幻觉程度在AI转录工具中前所未有。OpenAI声称,Whisper是一种开源神经网络,在英语语音识别中接近人类精度。它被广泛应用于各行业,用于转录采访、翻译内容和生成视频字幕等任务。
Whisper的广泛使用可能导致编造文本、错误引述和其他错误信息在各种平台上传播,影响因原始内容的性质而异。Whisper已集成到某些版本的ChatGPT中,用于呼叫中心、语音助手以及Oracle和Microsoft的云平台,上个月从HuggingFace下载超过420万次。
特别令人担忧的是,基于Whisper的工具越来越多地被医疗专业人员用于转录患者咨询。美联社采访了十几位工程师、研究人员和开发者,他们证实Whisper经常编造短语和整句,有时包括种族评论、暴力言论,甚至虚构的医疗治疗。
“没人希望被误诊,”高等研究院教授Alondra Nelson强调。
尽管OpenAI建议不要在高风险领域(如需要高精度的决策场景)使用Whisper,但该工具宣传的准确性使其对希望简化运营的各行业具有吸引力,常常忽视潜在风险。
问题不仅限于长或录制质量差的音频;研究人员发现,即使在短而清晰的音频样本中也存在幻觉。他们估计,这可能导致数百万录音中出现数万次错误转录。Gallaudet大学技术访问项目主任Christian Vogler(聾病患者)指出,聾病或听力障碍者可能无法察觉这些“隐藏在大量文本中的”幻觉。
这些发现凸显了AI行业的一个更广泛问题:在缺乏美国全面AI监管的情况下,为追求利润而急于推出产品。这尤其与OpenAI的盈利与非盈利地位之争以及近期领导层淡化AI风险的声明有关。
OpenAI发言人向美联社表示,公司正在持续努力减少幻觉,并重视研究人员的发现,将反馈纳入模型更新中。
与此同时,我们建议考虑Otter.ai,一种受记者信赖的可靠AI转录工具,最近新增了对六种新语言的支持。虽然一位长期用户报告称,新AI摘要功能中出现了一个幻觉统计数据,但该错误未出现在转录本身中。Otter.ai建议用户审查和编辑转录以确保准确性,特别是对于关键任务,指出准确性可能因背景噪音、口音和对话复杂性等因素而异。
对于iPhone用户,iOS 18.1的Apple Intelligence现提供AI驱动的通话录音和转录功能,尽管ZDNET主编Jason Hiner称其“仍在完善中”。
OpenAI最近宣布计划为其2.5亿ChatGPT Plus用户提供更多工具。
相关文章
谷歌双子座应用新增实时人工智能视频、深度研究和新功能 (120 字符)
谷歌在 2025 年 I/O 开发者大会上发布了 Gemini AI 的重大增强功能,扩展了多模态功能,引入了下一代 AI 模型,并加强了整个产品组合的生态系统集成。Gemini Live 的主要推出谷歌已正式向所有 iOS 和 Android 用户推出 Gemini Live 的视觉识别功能。该更新由最先进的 Project Astra 技术提供支持,结合来自设备摄像头或屏幕共享的实时视频分析,
Assort Health 获得 5000 万美元融资,实现患者沟通自动化
据熟悉该交易的消息人士透露,Assort Health 是一家新兴的人工智能医疗初创公司,专门为专科诊所提供自动患者沟通服务,该公司已获得约 5000 万美元的 B 轮融资,估值达 7.5 亿美元。这笔投资由光速创投(Lightspeed Venture Partners)领投,紧随该公司四个月前获得的 2200 万美元 A 轮融资之后。这家初创公司的人工智能语音技术可以处理日常行政工作,包括
使用人工智能 Excel 工具即时生成 Excel 公式
GPTExcel 是一款人工智能解决方案,可将自然语言描述转换为精确的 Excel 和 Google Sheets 公式,从而改变您的电子表格工作流程。这款功能强大的工具消除了手动创建公式的挫败感,使各种技能水平的用户都能进行复杂的数据分析。无论您是在管理预算、分析销售数据,还是在处理学术项目,GPTExcel 都能以出色的效率简化您的电子表格任务。主要优势人工智能驱动的公式:将简单的英语指令即时
评论 (18)
0/200
DouglasScott
2025-08-15 10:01:03
This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄
0
PaulLewis
2025-08-06 01:01:00
This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊
0
FrankSanchez
2025-08-04 14:48:52
This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔
0
WalterWhite
2025-04-16 11:50:21
このツールは本当に助かる!AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね!😊
0
HaroldLopez
2025-04-16 02:21:19
이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊
0
JimmyGarcia
2025-04-16 02:19:21
Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊
0
OpenAI的Whisper,一种于2022年发布的AI驱动的语音识别和转录工具,被发现经常产生幻觉或编造信息,引发对其在关键场景中可能造成危害的担忧。
密歇根大学的一位研究人员发现,他审查的公共会议音频转录中有80%存在幻觉。同样,一位分析了100小时Whisper转录的工程师报告称,其中约一半存在幻觉,另一位开发者发现他创建的几乎每个转录中都有幻觉,总计26,000次。
虽然转录中的小错误很常见,但专家指出,Whisper的幻觉程度在AI转录工具中前所未有。OpenAI声称,Whisper是一种开源神经网络,在英语语音识别中接近人类精度。它被广泛应用于各行业,用于转录采访、翻译内容和生成视频字幕等任务。
Whisper的广泛使用可能导致编造文本、错误引述和其他错误信息在各种平台上传播,影响因原始内容的性质而异。Whisper已集成到某些版本的ChatGPT中,用于呼叫中心、语音助手以及Oracle和Microsoft的云平台,上个月从HuggingFace下载超过420万次。
特别令人担忧的是,基于Whisper的工具越来越多地被医疗专业人员用于转录患者咨询。美联社采访了十几位工程师、研究人员和开发者,他们证实Whisper经常编造短语和整句,有时包括种族评论、暴力言论,甚至虚构的医疗治疗。
“没人希望被误诊,”高等研究院教授Alondra Nelson强调。
尽管OpenAI建议不要在高风险领域(如需要高精度的决策场景)使用Whisper,但该工具宣传的准确性使其对希望简化运营的各行业具有吸引力,常常忽视潜在风险。
问题不仅限于长或录制质量差的音频;研究人员发现,即使在短而清晰的音频样本中也存在幻觉。他们估计,这可能导致数百万录音中出现数万次错误转录。Gallaudet大学技术访问项目主任Christian Vogler(聾病患者)指出,聾病或听力障碍者可能无法察觉这些“隐藏在大量文本中的”幻觉。
这些发现凸显了AI行业的一个更广泛问题:在缺乏美国全面AI监管的情况下,为追求利润而急于推出产品。这尤其与OpenAI的盈利与非盈利地位之争以及近期领导层淡化AI风险的声明有关。
OpenAI发言人向美联社表示,公司正在持续努力减少幻觉,并重视研究人员的发现,将反馈纳入模型更新中。
与此同时,我们建议考虑Otter.ai,一种受记者信赖的可靠AI转录工具,最近新增了对六种新语言的支持。虽然一位长期用户报告称,新AI摘要功能中出现了一个幻觉统计数据,但该错误未出现在转录本身中。Otter.ai建议用户审查和编辑转录以确保准确性,特别是对于关键任务,指出准确性可能因背景噪音、口音和对话复杂性等因素而异。
对于iPhone用户,iOS 18.1的Apple Intelligence现提供AI驱动的通话录音和转录功能,尽管ZDNET主编Jason Hiner称其“仍在完善中”。
OpenAI最近宣布计划为其2.5亿ChatGPT Plus用户提供更多工具。



This transcription tool sounds like a game-changer! If it really cuts down on AI hallucinations, it could be a big win for accuracy in sensitive fields like medicine or law. Excited to see how it stacks up against Whisper! 😄




This transcription tool sounds promising! Less hallucination is a big win for accuracy. Excited to see how it stacks up in real-world use. 😊




This new AI transcription tool sounds like a game-changer! Whisper’s hallucinations were such a mess for serious work, so I’m hyped to see something more accurate. Can it handle noisy audio though? 🤔




このツールは本当に助かる!AIが勝手に作り出す幻覚がなく、非常に正確です。もう少し早く動いてくれると嬉しいけど、正確さが最優先だからね!😊




이 도구는 정말 구세주예요! AI가 내 녹취록에 허구를 만들어내는 걱정은 이제 안 해요. 정말 정확하고, 짜증나는 환각도 줄어들었어요. 조금만 더 빨라지면 좋겠지만, 정확성이 더 중요하죠! 😊




Essa ferramenta é um salva-vidas! Não preciso mais me preocupar com a IA inventando coisas nas minhas transcrições. É super precisa e realmente reduz aquelas alucinações irritantes. Só gostaria que fosse um pouco mais rápida, mas, né, precisão acima de velocidade qualquer dia! 😊












