Mistral 推出开创性的开源音频人工智能模型 Voxtral
随着人工智能系统的日益成熟,语音正迅速成为我们与机器互动的主要方式。法国人工智能初创公司 Mistral 已进入音频领域,推出首个开放式模型,通过提供开放式替代方案,挑战封闭式企业系统的主导地位。
本周二,Mistral 推出了 Voxtral,这是其专为商业用途设计的首个音频模型系列。
该公司将 Voxtral 定位为第一个能够提供 "真正可用的生产语音智能 "的开放模型。
这意味着开发人员不再需要在价格低廉但不准确的开放式系统和功能强大但成本高昂且部署控制受限的封闭式系统之间做出选择。
对于企业来说,Voxtral 提供了一种经济高效的替代方案,Mistral 声称其价格 "不到同类解决方案的一半"。

图片来源:MistralMistral Mistral 称,Voxtral 最多可转录 30 分钟的音频。得益于其 LLM 骨干 Mistral Small 3.1,它可以理解长达 40 分钟的音频,使用户能够就音频提问、生成摘要或将语音命令转换为实时操作,如 API 调用或函数执行。Voxtral 支持多种语言,能够转录和理解英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语和意大利语。
该公司正在发布其 "语音理解模型 "的两个变体。第一种是 Voxtral Small,具有 24B 参数,适合生产规模的部署,与 ElevenLabs Scribe、GPT-4o-mini 和 Gemini 2.5 Flash 竞争。
Techcrunch 活动 现在直播!TechCrunch All Stage
更智能地构建。更快扩展。连接更深入。与来自 Precursor Ventures、NEA、Index Ventures、Underscore VC 等公司的领导人一起,参加为期一天的战略、研讨会和宝贵的交流活动。
TechCrunch All Stage 通行证可节省 450 美元
更智能地构建。更快扩展。连接更深入。与来自 Precursor Ventures、NEA、Index Ventures、Underscore VC 等公司的领导人一起,参加为期一天的战略、研讨会和宝贵的交流活动。
马萨诸塞州波士顿 7 月 15 日 现在注册 第二款产品 Voxtral Mini 有 30 亿个参数,适用于本地和边缘部署。此外,还有一款超实惠、精简、快速 API 的 3B 型号版本,名为 Voxtral Mini Transcribe,仅针对转录任务进行了优化,旨在以不到一半的成本超越 OpenAI Whisper。
用户可以从 Hugging Face 下载 API 或在 Mistral 的聊天机器人 Le Chat 中试用模型,免费测试 Voxtral。据该公司称,应用程序的 API 集成起价为每分钟 0.001 美元。
Mistral在上个月发布了Magistral,这是该公司的第一个推理模型系列,可逐步解决问题,提高可靠性。
Mistral 是欧洲一家领先的人工智能公司,以倡导开源人工智能模型而闻名。本月早些时候,TechCrunch 报道称,该公司正在与阿布扎比的 MGX 基金等投资者谈判,以筹集高达 10 亿美元的资金。
相关文章
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图
Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术,作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上,Kakao Mobility副总裁兼物理AI部门负责人金镇奎(Kim Jin-kyu)介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道,这场题为“超越构想,付诸行动:AI驱动现实”的活动汇聚了来自17个国家的460
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
相关专题推荐
评论 (0)
0/500
随着人工智能系统的日益成熟,语音正迅速成为我们与机器互动的主要方式。法国人工智能初创公司 Mistral 已进入音频领域,推出首个开放式模型,通过提供开放式替代方案,挑战封闭式企业系统的主导地位。
本周二,Mistral 推出了 Voxtral,这是其专为商业用途设计的首个音频模型系列。
该公司将 Voxtral 定位为第一个能够提供 "真正可用的生产语音智能 "的开放模型。
这意味着开发人员不再需要在价格低廉但不准确的开放式系统和功能强大但成本高昂且部署控制受限的封闭式系统之间做出选择。
对于企业来说,Voxtral 提供了一种经济高效的替代方案,Mistral 声称其价格 "不到同类解决方案的一半"。

Mistral 称,Voxtral 最多可转录 30 分钟的音频。得益于其 LLM 骨干 Mistral Small 3.1,它可以理解长达 40 分钟的音频,使用户能够就音频提问、生成摘要或将语音命令转换为实时操作,如 API 调用或函数执行。Voxtral 支持多种语言,能够转录和理解英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语和意大利语。
该公司正在发布其 "语音理解模型 "的两个变体。第一种是 Voxtral Small,具有 24B 参数,适合生产规模的部署,与 ElevenLabs Scribe、GPT-4o-mini 和 Gemini 2.5 Flash 竞争。
Techcrunch 活动现在直播!TechCrunch All Stage
更智能地构建。更快扩展。连接更深入。与来自 Precursor Ventures、NEA、Index Ventures、Underscore VC 等公司的领导人一起,参加为期一天的战略、研讨会和宝贵的交流活动。
TechCrunch All Stage 通行证可节省 450 美元
更智能地构建。更快扩展。连接更深入。与来自 Precursor Ventures、NEA、Index Ventures、Underscore VC 等公司的领导人一起,参加为期一天的战略、研讨会和宝贵的交流活动。
马萨诸塞州波士顿 7 月 15 日 现在注册第二款产品 Voxtral Mini 有 30 亿个参数,适用于本地和边缘部署。此外,还有一款超实惠、精简、快速 API 的 3B 型号版本,名为 Voxtral Mini Transcribe,仅针对转录任务进行了优化,旨在以不到一半的成本超越 OpenAI Whisper。
用户可以从 Hugging Face 下载 API 或在 Mistral 的聊天机器人 Le Chat 中试用模型,免费测试 Voxtral。据该公司称,应用程序的 API 集成起价为每分钟 0.001 美元。
Mistral在上个月发布了Magistral,这是该公司的第一个推理模型系列,可逐步解决问题,提高可靠性。
Mistral 是欧洲一家领先的人工智能公司,以倡导开源人工智能模型而闻名。本月早些时候,TechCrunch 报道称,该公司正在与阿布扎比的 MGX 基金等投资者谈判,以筹集高达 10 亿美元的资金。
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问





首页






