Sesame presenta el modelo base de IA detrás del asistente virtual viral Maya

Hogar

Noticias

23 de abril de 2025

DouglasHarris

169

# ai # Sesame # Maya

Sesame presenta el modelo base de IA detrás del asistente virtual viral Maya

Sesame, la innovadora empresa de IA detrás de la asistente de voz sorprendentemente realista Maya, acaba de causar sensación al lanzar el modelo base que impulsa sus capacidades. Denominado CSM-1B, este modelo cuenta con un tamaño de mil millones de parámetros, un término que se refiere a los componentes individuales que conforman el modelo. Lanzado bajo una licencia Apache 2.0, está abierto para uso comercial con restricciones mínimas, según se anunció en la plataforma de desarrollo de IA Hugging Face.

CSM-1B funciona convirtiendo entradas de texto y audio en "códigos de audio RVQ". RVQ significa "cuantización vectorial residual", un método que transforma el audio en tokens discretos o códigos. Esta técnica también se utiliza en otras tecnologías de audio de IA de vanguardia, como SoundStream de Google y Encodec de Meta. En su núcleo, CSM-1B aprovecha un modelo de la familia Llama de Meta, combinado con un componente de "decodificador" de audio. Una versión especializada de CSM-1B, tras un ajuste fino, da voz a Maya, según Sesame.

Describiendo el modelo como un "modelo de generación base" en sus repositorios de Hugging Face y GitHub, Sesame señala que está diseñado para producir una variedad de voces, pero no ha sido refinado para ninguna voz específica. Aunque tiene cierta capacidad para manejar idiomas no ingleses gracias a la "contaminación de datos" en su conjunto de entrenamiento, su rendimiento en esta área probablemente sea deficiente. Curiosamente, Sesame ha mantenido en secreto los detalles de los datos de entrenamiento, dejándonos curiosos sobre qué se utilizó para construir este modelo.

Un aspecto que llama la atención es la falta de salvaguardas sólidas. Sesame opera bajo un sistema de honor, simplemente animando a los usuarios y desarrolladores a evitar usar el modelo para replicar la voz de alguien sin permiso, producir contenido engañoso como noticias falsas o participar en actividades "dañinas" o "maliciosas". Personalmente probé la demostración en Hugging Face, y en un minuto había clonado mi voz. Fue muy fácil generar un discurso sobre cualquier tema, incluso temas sensibles como las elecciones y la propaganda rusa.

Consumer Reports destacó recientemente la preocupante falta de salvaguardas "significativas" en muchas herramientas de clonación de voz impulsadas por IA, lo que podría conducir a posibles fraudes o abusos. Sesame, cofundada por el cocreador de Oculus, Brendan Iribe, captó la atención del público a finales de febrero con su tecnología de asistente que casi escapa del valle inquietante. Tanto Maya como el otro asistente de Sesame, Miles, exhiben rasgos humanos realistas, como respirar, hablar con disfluencias y ser interrumpibles a mitad del discurso, similar al Voice Mode de OpenAI.

Financieramente, Sesame ha asegurado una financiación no revelada de pesos pesados como Andreessen Horowitz, Spark Capital y Matrix Partners. Más allá de los asistentes de voz, la empresa también está incursionando en la creación de prototipos de gafas de IA destinadas a ser usadas todo el día, equipadas con sus modelos personalizados. Este movimiento muestra la ambición de Sesame de empujar los límites de la tecnología de IA aún más en nuestras vidas diarias.

Artículo relacionado

WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an

Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE

Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere

Recomendaciones de temas especiales relacionados

Creación de animación

Generador de anime AI para Donghua: Crea personajes para novelas web y avatares para cómics

Descubra los mejores generadores de anime de IA para donghua en 2026. Nuestra lista seleccionada y calificada incluye herramientas poderosas para crear increíbles personajes para novelas web y avatares de cómics. Compare opciones gratuitas y pagadas a través de pruebas reales. Encuentre su compañero creativo ideal y dé vida a sus historias hoy mismo en XIX.AI.

10 herramientas

xix.ai

Creación de cómics

Las mejores herramientas de coloración automática con IA para manga: aplica colores planos sin ningún error de coherencia

Descubre las mejores herramientas de coloración automática con IA para manga de 2026 en XIX.AI. Nuestra lista seleccionada incluye soluciones revolucionarias y mejor valoradas que aplican colores planos sin ningún error de consistencia, lo que potencia tu productividad. Explora comparativas entre opciones gratuitas y de pago, pruebas en condiciones reales y clasificaciones actualizadas semanalmente para encontrar la opción perfecta para ti. Aprovecha hoy mismo las ventajas de la IA.

10 herramientas

xix.ai

escribiendo

Los mejores creadores de perfiles de ficción con IA: cómo generar motivaciones y defectos fatales coherentes para los personajes

Descubre los mejores creadores de perfiles de ficción con IA de 2026 para dar vida a personajes profundos. La selección de XIX.AI incluye herramientas de primera categoría y revolucionarias que generan motivaciones coherentes y defectos fatales. Compara las opciones gratuitas con las de pago mediante pruebas en el mundo real. Libera ahora tu potencial narrativo.

10 herramientas

xix.ai

Negocio

El mejor software de optimización de precios con IA: realiza un seguimiento de la competencia y ajusta automáticamente los precios de la tienda

Descubre el mejor software de optimización de precios con IA de 2026 en XIX.AI. Nuestra selección incluye herramientas de primera categoría y revolucionarias que analizan a la competencia y ajustan automáticamente los precios de tu tienda para maximizar los beneficios. Compara las opciones gratuitas con las de pago mediante pruebas reales. Aprovecha ahora tu ventaja competitiva en materia de precios.

10 herramientas

xix.ai

código

Los mejores revisores de código basados en IA: automatiza el cumplimiento de las normas de código limpio y refactoriza los archivos de repositorios heredados

Descubre los mejores revisores de código con IA de 2026 en XIX.AI. Nuestra lista seleccionada incluye herramientas de primera categoría y revolucionarias para automatizar el cumplimiento de las normas de código limpio y refactorizar archivos de repositorios heredados. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo tu ventaja con la IA.

10 herramientas

xix.ai

Texto a voz

Las mejores aplicaciones de síntesis de voz con IA para la dislexia: apoyo al aprendizaje y mejora de la eficiencia en la lectura de los estudiantes

Descubre las mejores aplicaciones de TTS con IA de 2026, seleccionadas específicamente para ayudar a las personas con dislexia. Nuestra clasificación, elaborada por expertos, compara herramientas gratuitas y de pago, y destaca sus potentes funciones para mejorar la eficiencia en la lectura y el aprendizaje. Explora soluciones innovadoras e imprescindibles para liberar el potencial de los estudiantes. Empieza tu viaje en XIX.AI.

10 herramientas

xix.ai

comentario (8)

0/500

Inicie sesión primero

PaulYoung

13 de agosto de 2025 23:00:59 GMT+02:00

C'est incroyable ce que Sesame a fait avec Maya ! Un modèle à 1 milliard de paramètres, ça doit être une sacrée bête. Mais franchement, ça donne quoi en termes d'éthique ? On va tous finir avec des assistants trop parfaits ? 😅

AnthonyMartinez

31 de julio de 2025 03:41:20 GMT+02:00

Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎

RoySmith

28 de julio de 2025 03:18:39 GMT+02:00

Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀

EricPerez

25 de abril de 2025 00:42:49 GMT+02:00

Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯

GeorgeMiller

24 de abril de 2025 15:04:42 GMT+02:00

¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯

JonathanMiller

24 de abril de 2025 14:11:38 GMT+02:00

Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯

Noticias principales

AI Builder y Power Automate Revolucionan la Sumarización de Documentos Los anfitriones de AI del podcast Notebooklm ahora están disponibles para entrevistas China presenta su robot humanoide nacional y sus estándares de inteligencia incorporada Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas Guía de creación de arte con el creador de imágenes de Bing Aprende a crear música de IA usando tu voz: un tutorial de Suno paso a paso iMyFone MagicMic: Revisión y Tutorial de Cambio de Voz AI en Tiempo Real Generadores de Video AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como un revolucionario sistema de IA multimodal Embodied Intelligence presenta la primera norma del sector para frenar el crecimiento descontrolado

Más

Presentado