ElevenLabs 创下语音转文本新基准;Google Gemini 紧随其后,展现出广泛的能力
Artificial Analysis 发布了其语音转文本基准测试的最新版本——AA-WER v2.0。测试结果显示,ElevenLabs 和 Google 在音频转录性能方面遥遥领先。

在核心词错误率(WER)的测评中,ElevenLabs的Scribe v2以2.3%这一令人印象深刻的低错误率位居榜首。紧随其后的是Google的Gemini3Pro, 错误率为2.9%。值得注意的是,Google并未针对转录任务对Gemini进行微调;这一结果完全源于其强大的多模态通用能力。
其他领先模型的测试结果如下:
Mistral Voxtral Small:以3.0%的错误率位列第三。
Google Gemini3Flash:表现稳健,错误率为3.1%。
OpenAI Whisper Large v3:这款最广泛使用的开源模型以4.2%的错误率位列中游。
表现最差的模型:阿里巴巴的Qwen3ASR Flash(5.9%)、亚马逊的Nova2Omni(6.0%)以及Rev AI(6.1%)位列榜单末尾。

在专用于语音助手指令的AA-AgentTalk基准测试中,排名榜单保持稳定。ElevenLabs 的 Scribe v2 和 Google 的 Gemini3Pro 分别以1.6%和1.7%的错误率保持领先,证明了其在简短、直接的语音交互中具有极高的可靠性。
相关文章
免费开源AI国际象棋引擎Maia 3正式发布,旨在提升人类的棋艺水平
Maia Chess团队发布了一款新的开源国际象棋引擎——Maia 3,该引擎基于2.5亿局真实人类对局进行训练。其Elo等级分达到约1800分,比上一版本高出近300分。 最棒的是,它完全免费且开源,支持本地部署,标志着让人工智能国际象棋引擎普及大众迈出了重要一步。独特方法:模拟人类决策与AlphaZero和Stockfish等旨在实现Elo等级分超过3500的超人类水平顶级引擎不同,Maia专
人工智能风险投资热潮推动单季营收突破万亿元,掀起新一轮创新浪潮
全球人工智能领域的风险投资正呈现爆发式增长。今年第一季度,共完成了近600轮人工智能相关融资,总额超过1100亿元人民币,同比增长185.4%。资本主要集中于三大关键领域5月,国内领先的大模型公司如Moonshot和Step Star取得进一步进展,融资额超过300亿元。与此同时,具身智能领域也吸引了大量投资,新兴企业VITA Dynamics和Luming Robotics在一周内分别完成了数十
OpenAI 停用 o3 和 GPT-4.5 大型模型
作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充
相关专题推荐
评论 (1)
0/500
Artificial Analysis 发布了其语音转文本基准测试的最新版本——AA-WER v2.0。测试结果显示,ElevenLabs 和 Google 在音频转录性能方面遥遥领先。

在核心词错误率(WER)的测评中,ElevenLabs的Scribe v2以2.3%这一令人印象深刻的低错误率位居榜首。紧随其后的是Google的Gemini3Pro, 错误率为2.9%。值得注意的是,Google并未针对转录任务对Gemini进行微调;这一结果完全源于其强大的多模态通用能力。
其他领先模型的测试结果如下:
Mistral Voxtral Small:以3.0%的错误率位列第三。
Google Gemini3Flash:表现稳健,错误率为3.1%。
OpenAI Whisper Large v3:这款最广泛使用的开源模型以4.2%的错误率位列中游。
表现最差的模型:阿里巴巴的Qwen3ASR Flash(5.9%)、亚马逊的Nova2Omni(6.0%)以及Rev AI(6.1%)位列榜单末尾。

在专用于语音助手指令的AA-AgentTalk基准测试中,排名榜单保持稳定。ElevenLabs 的 Scribe v2 和 Google 的 Gemini3Pro 分别以1.6%和1.7%的错误率保持领先,证明了其在简短、直接的语音交互中具有极高的可靠性。
人工智能风险投资热潮推动单季营收突破万亿元,掀起新一轮创新浪潮
全球人工智能领域的风险投资正呈现爆发式增长。今年第一季度,共完成了近600轮人工智能相关融资,总额超过1100亿元人民币,同比增长185.4%。资本主要集中于三大关键领域5月,国内领先的大模型公司如Moonshot和Step Star取得进一步进展,融资额超过300亿元。与此同时,具身智能领域也吸引了大量投资,新兴企业VITA Dynamics和Luming Robotics在一周内分别完成了数十
OpenAI 停用 o3 和 GPT-4.5 大型模型
作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充





首页






