选项
首页
新闻
ElevenLabs 创下语音转文本新基准;Google Gemini 紧随其后,展现出广泛的能力

ElevenLabs 创下语音转文本新基准;Google Gemini 紧随其后,展现出广泛的能力

2026-03-17
139

Artificial Analysis 发布了其语音转文本基准测试的最新版本——AA-WER v2.0。测试结果显示,ElevenLabs 和 Google 在音频转录性能方面遥遥领先。

image.png

在核心词错误率(WER)的测评中,ElevenLabs的Scribe v2以2.3%这一令人印象深刻的低错误率位居榜首。紧随其后的是Google的Gemini3Pro, 错误率为2.9%。值得注意的是,Google并未针对转录任务对Gemini进行微调;这一结果完全源于其强大的多模态通用能力。

其他领先模型的测试结果如下:

Mistral Voxtral Small:以3.0%的错误率位列第三。

Google Gemini3Flash:表现稳健,错误率为3.1%

OpenAI Whisper Large v3:这款最广泛使用的开源模型以4.2%的错误率位列中游。

表现最差的模型:阿里巴巴的Qwen3ASR Flash(5.9%)、亚马逊的Nova2Omni(6.0%)以及Rev AI(6.1%)位列榜单末尾。

image.png

在专用于语音助手指令的AA-AgentTalk基准测试中,排名榜单保持稳定。ElevenLabs 的 Scribe v2 和 Google 的 Gemini3Pro 分别以1.6%1.7%的错误率保持领先,证明了其在简短、直接的语音交互中具有极高的可靠性。

相关文章
免费开源AI国际象棋引擎Maia 3正式发布,旨在提升人类的棋艺水平 免费开源AI国际象棋引擎Maia 3正式发布,旨在提升人类的棋艺水平 Maia Chess团队发布了一款新的开源国际象棋引擎——Maia 3,该引擎基于2.5亿局真实人类对局进行训练。其Elo等级分达到约1800分,比上一版本高出近300分。 最棒的是,它完全免费且开源,支持本地部署,标志着让人工智能国际象棋引擎普及大众迈出了重要一步。独特方法:模拟人类决策与AlphaZero和Stockfish等旨在实现Elo等级分超过3500的超人类水平顶级引擎不同,Maia专
人工智能风险投资热潮推动单季营收突破万亿元,掀起新一轮创新浪潮 人工智能风险投资热潮推动单季营收突破万亿元,掀起新一轮创新浪潮 全球人工智能领域的风险投资正呈现爆发式增长。今年第一季度,共完成了近600轮人工智能相关融资,总额超过1100亿元人民币,同比增长185.4%。资本主要集中于三大关键领域5月,国内领先的大模型公司如Moonshot和Step Star取得进一步进展,融资额超过300亿元。与此同时,具身智能领域也吸引了大量投资,新兴企业VITA Dynamics和Luming Robotics在一周内分别完成了数十
OpenAI 停用 o3 和 GPT-4.5 大型模型 OpenAI 停用 o3 和 GPT-4.5 大型模型 作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充
相关专题推荐
写作 最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字
最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单,助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具
xix.ai
图像编辑 用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计
用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计

2026最新推荐:探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具,帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项,查看实际测试结果,从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析,让您立即开始将故事可视化呈现吧!

10 个工具
xix.ai
写作 最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告
最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告

在XIX.AI上,发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧!

10 个工具
xix.ai
商业 最佳 AI 合同审查软件:即时发现法律漏洞与合规风险
最佳 AI 合同审查软件:即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具,能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名,对比免费与付费选项。找到能彻底改变游戏规则的解决方案,实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具
xix.ai
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
评论 (1)
0/500
LiamWalker
LiamWalker 2026-05-14 20:00:20

Just tried ElevenLabs' API and the accuracy is insane for my podcast clips! Gemini being close behind means we're finally getting real competition in this space. Can't wait to see prices drop as they fight it out. 🎧

OR