Hogar
El director ejecutivo de ElevenLabs predice que las herramientas de audio con inteligencia artificial se convertirán en productos básicos.

Mati Staniszewski, director ejecutivo y cofundador de la empresa de audio con IA ElevenLabs, hizo recientemente una declaración reveladora para una empresa dedicada a la creación de modelos de IA: cree que estos modelos acabarán convirtiéndose en un producto básico.
Compartió esta perspectiva mientras debatía sobre el futuro del audio basado en IA en el escenario de la conferencia TechCrunch Disrupt 2025 este martes, en la que expuso sus perspectivas a corto y largo plazo para este campo.
Staniszewski señaló que el equipo de investigación de su empresa ha abordado con éxito los retos clave en la arquitectura de modelos, y que este enfoque en el desarrollo de modelos básicos seguirá siendo una prioridad durante los próximos dos años.
«La tecnología se convertirá en un producto básico a largo plazo, en los próximos años», predijo Staniszewski. «Aunque persistan las diferencias en determinadas voces o idiomas, la brecha general en las capacidades básicas se reducirá significativamente».
Cuando se le preguntó por qué ElevenLabs se concentraría en la creación de modelos si estos están destinados a convertirse en productos básicos, Staniszewski aclaró que, por ahora, representan «la ventaja competitiva más significativa y el avance más sustancial disponible».
Citó el problema actual de las voces o interacciones de IA que carecen de calidad y naturalidad como un problema que aún requiere una solución.
«La única forma de resolverlo actualmente es... desarrollar los modelos internamente. A largo plazo, otros actores también abordarán este reto», explicó Staniszewski.
Añadió que, para aplicaciones fiables y escalables, es probable que los usuarios sigan empleando modelos especializados adaptados a tareas específicas.
De cara al futuro, Staniszewski prevé un cambio en los próximos dos años, con un número creciente de modelos que adoptarán arquitecturas multimodales o fusionadas.
«Esto significa que se generará audio y vídeo simultáneamente, o se combinará el audio con grandes modelos de lenguaje en una interfaz conversacional», afirmó, señalando Veo 3 de Google como un ejemplo de lo que pueden lograr los modelos integrados.
El fundador reveló que ElevenLabs tiene la intención de buscar asociaciones y explorar tecnologías de código abierto para fusionar su especialización en audio con los puntos fuertes de otros modelos de IA.
Según afirmó, la estrategia de la empresa consiste en invertir tanto en el desarrollo de modelos fundamentales como en aplicaciones prácticas para crear un valor duradero.
«Al igual que la sinergia entre el software y el hardware fue revolucionaria para Apple, creemos que la combinación del diseño de productos y la IA definirá la próxima generación de casos de uso transformadores», concluyó.
Artículo relacionado
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física
Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
YouTube amplía la detección de deepfakes mediante IA a políticos, funcionarios públicos y periodistas
El martes, YouTube anunció que va a ampliar su tecnología de detección de deepfakes a un grupo selecto de funcionarios públicos, candidatos políticos y periodistas. La herramienta identifica las imáge
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

Mati Staniszewski, director ejecutivo y cofundador de la empresa de audio con IA ElevenLabs, hizo recientemente una declaración reveladora para una empresa dedicada a la creación de modelos de IA: cree que estos modelos acabarán convirtiéndose en un producto básico.
Compartió esta perspectiva mientras debatía sobre el futuro del audio basado en IA en el escenario de la conferencia TechCrunch Disrupt 2025 este martes, en la que expuso sus perspectivas a corto y largo plazo para este campo.
Staniszewski señaló que el equipo de investigación de su empresa ha abordado con éxito los retos clave en la arquitectura de modelos, y que este enfoque en el desarrollo de modelos básicos seguirá siendo una prioridad durante los próximos dos años.
«La tecnología se convertirá en un producto básico a largo plazo, en los próximos años», predijo Staniszewski. «Aunque persistan las diferencias en determinadas voces o idiomas, la brecha general en las capacidades básicas se reducirá significativamente».
Cuando se le preguntó por qué ElevenLabs se concentraría en la creación de modelos si estos están destinados a convertirse en productos básicos, Staniszewski aclaró que, por ahora, representan «la ventaja competitiva más significativa y el avance más sustancial disponible».
Citó el problema actual de las voces o interacciones de IA que carecen de calidad y naturalidad como un problema que aún requiere una solución.
«La única forma de resolverlo actualmente es... desarrollar los modelos internamente. A largo plazo, otros actores también abordarán este reto», explicó Staniszewski.
Añadió que, para aplicaciones fiables y escalables, es probable que los usuarios sigan empleando modelos especializados adaptados a tareas específicas.
De cara al futuro, Staniszewski prevé un cambio en los próximos dos años, con un número creciente de modelos que adoptarán arquitecturas multimodales o fusionadas.
«Esto significa que se generará audio y vídeo simultáneamente, o se combinará el audio con grandes modelos de lenguaje en una interfaz conversacional», afirmó, señalando Veo 3 de Google como un ejemplo de lo que pueden lograr los modelos integrados.
El fundador reveló que ElevenLabs tiene la intención de buscar asociaciones y explorar tecnologías de código abierto para fusionar su especialización en audio con los puntos fuertes de otros modelos de IA.
Según afirmó, la estrategia de la empresa consiste en invertir tanto en el desarrollo de modelos fundamentales como en aplicaciones prácticas para crear un valor duradero.
«Al igual que la sinergia entre el software y el hardware fue revolucionaria para Apple, creemos que la combinación del diseño de productos y la IA definirá la próxima generación de casos de uso transformadores», concluyó.
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
YouTube amplía la detección de deepfakes mediante IA a políticos, funcionarios públicos y periodistas
El martes, YouTube anunció que va a ampliar su tecnología de detección de deepfakes a un grupo selecto de funcionarios públicos, candidatos políticos y periodistas. La herramienta identifica las imáge











