opción
Hogar
Noticias
Sesame presenta el modelo base de IA detrás del asistente virtual viral Maya

Sesame presenta el modelo base de IA detrás del asistente virtual viral Maya

23 de abril de 2025
103

Sesame presenta el modelo base de IA detrás del asistente virtual viral Maya

Sesame, la innovadora compañía de IA detrás del asistente de voz sorprendentemente realista Maya, acaba de hacer olas al liberar el modelo base que impulsa sus capacidades. Apodado CSM-1B, este modelo cuenta con un tamaño de mil millones de parámetros, un término que se refiere a los componentes individuales que componen el modelo. Lanzado bajo una licencia Apache 2.0, está abierto para uso comercial con restricciones mínimas, como se anunció en la plataforma de desarrollo de IA, abrazando la cara.

Funciones CSM-1B convirtiendo las entradas de texto y audio en "códigos de audio RVQ". RVQ significa "Cuantización del vector residual", un método que transforma el audio en tokens o códigos discretos. Esta técnica también se utiliza en otras tecnologías de audio de IA de vanguardia, como SoundStream y Meta's Codec de Google. En esencia, CSM-1B aprovecha un modelo de la familia Llama de Meta, combinado con un componente de audio "decodificador". Según Sesame, una versión especializada de CSM-1b, después de ajustar, alimenta la voz de Maya.

Al describir el modelo como un "modelo de generación base" en su rostro abrazante y repositorios de GitHub, Sesame señala que está diseñado para producir una variedad de voces, pero no se ha refinado para ninguna voz específica. Si bien tiene cierta capacidad para manejar los idiomas no ingleses gracias a la "contaminación de datos" en su conjunto de capacitación, su rendimiento en esta área es probablemente deficiente. Curiosamente, Sesame ha mantenido los detalles de los datos de capacitación en secreto, dejándonos curiosos sobre lo que se destinó a construir este modelo.

Un aspecto que eleva las cejas es la falta de salvaguardas robustas. Sesame opera en un sistema de honor, simplemente alentando a los usuarios y desarrolladores a evitar usar el modelo para replicar la voz de alguien sin permiso, producir contenido engañoso como noticias falsas o participar en cualquier actividad "dañina" o "maliciosa". Probé personalmente la demostración en la cara abrazada, y en un minuto, había clonado mi voz. Fue muy fácil generar un discurso sobre cualquier tema, incluso los sensibles como las elecciones y la propaganda rusa.

Consumer Reports recientemente destacó la falta de salvaguardas "significativas" en muchas herramientas de clonación de voz con IA, lo que podría conducir a un posible fraude o abuso. Sesame, cofundado por el cocreador de Oculus, Brendan Iribe, llamó el ojo del público a fines de febrero con su tecnología asistente que casi escapa del extraño valle. Tanto el otro asistente de Maya como el otro asistente, Miles, exhiben rasgos realistas similares a los humanos, como respirar, hablar con disfluencias y ser interrumpibles a mitad del habla, similar al modo de voz de Openi.

Financieramente, Sesame ha obtenido fondos no revelados de pesos pesados ​​como Andreessen Horowitz, Spark Capital y Matrix Partners. Más allá de los asistentes de voz, la compañía también se está aventurando en prototipos de gafas de inteligencia artificial destinada a la ropa durante todo el día, equipada con sus modelos personalizados. Este movimiento muestra la ambición de Sesame de superar los límites de la tecnología de IA en nuestra vida diaria.

Artículo relacionado
Alibaba presenta Wan2.1-VACE: solución de video de IA de código abierto Alibaba presenta Wan2.1-VACE: solución de video de IA de código abierto Alibaba ha presentado Wan2.1-VACE, un modelo de IA de código abierto diseñado para transformar los procesos de creación y edición de videos.VACE es un componente clave de la familia de modelos de IA d
IBM Power11 Impulsa la IA Empresarial con Rendimiento Ininterrumpido IBM Power11 Impulsa la IA Empresarial con Rendimiento Ininterrumpido Los servidores empresariales Power11 de IBM abordan un problema clave en la informática empresarial: implementar cargas de trabajo de IA mientras se mantiene la robusta confiabilidad requerida para ap
Experimento de Retail Potenciado por IA Falla Espectacularmente en Anthropic Experimento de Retail Potenciado por IA Falla Espectacularmente en Anthropic Imagina entregar una pequeña tienda a una inteligencia artificial, confiándole todo, desde los precios hasta las interacciones con los clientes. ¿Qué podría salir mal?Un reciente estudio de Anthropic,
comentario (7)
0/200
AnthonyMartinez
AnthonyMartinez 31 de julio de 2025 03:41:20 GMT+02:00

Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎

RoySmith
RoySmith 28 de julio de 2025 03:18:39 GMT+02:00

Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀

EricPerez
EricPerez 25 de abril de 2025 00:42:49 GMT+02:00

Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯

GeorgeMiller
GeorgeMiller 24 de abril de 2025 15:04:42 GMT+02:00

¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯

JonathanMiller
JonathanMiller 24 de abril de 2025 14:11:38 GMT+02:00

Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯

TimothyMitchell
TimothyMitchell 24 de abril de 2025 09:25:54 GMT+02:00

SesameのMayaの基礎AIモデルは驚異的!10億のパラメータ?それは狂ってる!Mayaの声は本当にリアルで、まるで本物の人と話しているみたい。ただ、時々彼女がちょっとおしゃべりすぎてうざい時がある。それでも、素晴らしい技術だよ!🤯

Volver arriba
OR