选项
首页
新闻
芝麻揭开病毒虚拟助手玛雅背后的基础AI模型

芝麻揭开病毒虚拟助手玛雅背后的基础AI模型

2025-04-23
103

芝麻揭开病毒虚拟助手玛雅背后的基础AI模型

芝麻(Sesame)是一家创新的人工智能公司,这家栩栩如生的语音助手玛雅(Maya)刚刚通过释放了推动她能力的基础模型来引起轰动。该模型被称为CSM-1B,其大小为10亿个参数,该术语是指组成模型的单个组件。根据AI Development Platform Hugging Face宣布的,它是在Apache 2.0许可下发布的,供商业用途,并最少。

CSM-1B通过将文本和音频输入转换为“ RVQ音频代码”来函数。 RVQ代表“残留向量量化”,该方法将音频转换为离散令牌或代码。该技术还用于其他尖端AI音频技术,例如Google的Soundtream和Meta的Eccodec。 CSM-1B从本质上讲,利用了Meta的Llama家族的模型,并结合了音频“解码器”组件。根据芝麻的说法,经过微调,CSM-1B的专门版本为玛雅人的声音提供了动力。

芝麻将模型描述为其拥抱面和Github存储库中的“基本生成模型”,指出它旨在产生各种声音,但没有针对任何特定的声音进行完善。尽管由于其训练集中的“数据污染”,它具有某种能力处理非英语语言的能力,但其在该领域的表现可能不足。有趣的是,芝麻将培训数据的细节保留在包裹中,使我们对建立该模型的原因感到好奇。

引起眉毛的一个方面是缺乏强大的保障措施。芝麻在荣誉系统上运行,只是鼓励用户和开发人员避免使用模型在未经许可的情况下复制某人的声音,产生诸如假新闻之类的误导性内容,或参加任何“有害”或“恶意”活动。我亲自测试了演示,以拥抱脸,在一分钟之内,我克隆了自己的声音。在任何话题上发表演讲,甚至是敏感的选举和俄罗斯宣传,这都是轻而易举的。

最近,消费者的报告强调了许多AI驱动的语音克隆工具中缺乏“有意义的”保障措施,这可能导致潜在的欺诈或滥用。由Oculus共同创造者Brendan Iribe共同创立的芝麻在2月下旬与其助理技术吸引了公众的眼球,该技术几乎逃脱了不可思议的山谷。玛雅人和芝麻的另一个助手迈尔斯都表现出现实的人类般的特征,例如呼吸,散发出反弹性和可中断的言论中的中断,类似于Openai的语音模式。

从财务上讲,芝麻从Andreessen Horowitz,Spark Capital和Matrix Partners等重量级人物那里获得了未公开的资金。除了语音助手之外,该公司还冒险使用适用于全天服装的原型AI眼镜,配备了定制型号。此举表明芝麻的野心将AI技术的界限进一步推向了我们的日常生活。

相关文章
阿里巴巴发布Wan2.1-VACE:开源AI视频解决方案 阿里巴巴发布Wan2.1-VACE:开源AI视频解决方案 阿里巴巴推出了Wan2.1-VACE,这是一个开源AI模型,有望改变视频创作和编辑流程。VACE是阿里巴巴Wan2.1视频AI模型系列的关键组成部分,公司宣称这是“业内首个为多样化视频生成和编辑任务提供全面解决方案的开源模型。”如果阿里巴巴能够简化视频制作流程,将多种工具整合到一个单一平台上,可能会重新定义行业标准。VACE能做什么?它可以从多种输入生成视频,例如文本提示、静态图像或短视频片段。除
IBM Power11 提升企业AI,保障不间断性能 IBM Power11 提升企业AI,保障不间断性能 IBM的Power11企业服务器解决企业计算关键问题:在部署AI工作负载的同时,保持关键任务应用所需的高可靠性。2025年7月8日发布,Power11凸显IBM对统一解决方案的关注,摆脱许多组织目前面临的专用AI硬件与传统服务器的碎片化组合。核心创新揭晓Power11服务器确保企业无停机时间,具备惊人的“99.9999%正常运行时间”,相当于每年不到32秒的意外停机。IBM称其为“Power平台历
AI驱动的零售实验在Anthropic惨败 AI驱动的零售实验在Anthropic惨败 想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:
评论 (7)
0/200
AnthonyMartinez
AnthonyMartinez 2025-07-31 09:41:20

Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎

RoySmith
RoySmith 2025-07-28 09:18:39

Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀

EricPerez
EricPerez 2025-04-25 06:42:49

Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯

GeorgeMiller
GeorgeMiller 2025-04-24 21:04:42

¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯

JonathanMiller
JonathanMiller 2025-04-24 20:11:38

Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯

TimothyMitchell
TimothyMitchell 2025-04-24 15:25:54

SesameのMayaの基礎AIモデルは驚異的!10億のパラメータ?それは狂ってる!Mayaの声は本当にリアルで、まるで本物の人と話しているみたい。ただ、時々彼女がちょっとおしゃべりすぎてうざい時がある。それでも、素晴らしい技術だよ!🤯

返回顶部
OR