opción
Hogar
Noticias
Podcastle presenta texto a voz con más de 450 voces de IA

Podcastle presenta texto a voz con más de 450 voces de IA

10 de abril de 2025
114

Podcastle, la popular plataforma para la grabación y edición de podcasts, está saltando al juego de texto a voz de IA con su nuevo modelo, Asyncflow V1.0. No solo se detienen allí, sino que también están implementando una API para los desarrolladores, lo que hace que sea muy fácil conectar esta tecnología a sus propias aplicaciones.

Con Asyncflow V1.0, Podcastle ahora cuenta con más de 450 voces de IA listas para leer su texto en voz alta. La parte genial? Han logrado mantener bajos los costos de capacitación e inferencia, lo que les da una ventaja sobre la competencia.

Podcastle ahora está en la misma liga que otras nuevas empresas como ElevenLabs, Speechifify y Wellsaid, todo lo cual está utilizando AI para convertir el texto en palabras habladas. Esta tecnología tiene aplicaciones en todo el lugar, desde marketing y anuncios hasta hacer contenido, enseñanza e incluso capacitar a las personas en el trabajo.

Arto Yeritsyan, el cerebro detrás de Podcastle, le dijo a TechCrunch que han querido sumergirse en texto a voz por un tiempo. El problema? Era demasiado caro y hambriento de datos. Pero gracias a algunos avances recientes en modelos de idiomas grandes, finalmente descifraron el código el año pasado. "Hemos tenido el objetivo de construir un modelo sólido de texto a voz desde el principio", dijo Yeritsyan. "Pero los costos eran altos de cielo. Con la última tecnología, encontramos una manera de crear un modelo de voz de primer nivel sin necesidad de una montaña de datos".

Su recaudación de fondos de la serie A de $ 13.5 millones el año pasado también ayudó a alimentar este proyecto.

Cuando se trata de precios, Podcastle es bastante competitivo. Están cobrando alrededor de $ 40 por 500 minutos de conversión de texto a voz, mientras que Elevenlabs solicita $ 99 por la misma cantidad.

La función de clonación de voz de Podcastle también está obteniendo un estiramiento facial, lo que hace que el proceso de entrenamiento sea mucho más rápido. Antes, tenía que leer unas 70 oraciones para entrenar el sistema. Ahora, solo toma unos segundos de tu voz. Están usando su IA mágica de polvo, que lanzaron el año pasado, para aumentar la calidad de audio durante este nuevo proceso.

Créditos de imagen: Podcastle

Cuando lo probamos, la voz sonaba un poco robótica, pero atrapó nuestro tono bastante bien. Podcastle dice que están trabajando para hacerlo aún mejor. También puede entrenar el sistema con diferentes muestras de voz para obtener resultados variados.

Podcastle reconoce que, aparte de mantener los costos bajos, tener de todo, desde herramientas de audio y video hasta podcasts y narración de IA en un solo lugar los diferirá de la competencia. Yeritsyan mencionó que si bien la mayoría de los usuarios se apegan al contenido de audio, Video también comienza a ganar terreno.

Artículo relacionado
xAI posts Grok’s behind-the-scenes prompts xAI posts Grok’s behind-the-scenes prompts xAI Releases Grok's System Prompts After Controversial "White Genocide" ResponsesIn an unexpected move, xAI has decided to publicly share the system prompts for its AI chatbot Grok after an incident where the bot began generating unprompted responses about "white genocide" on X (formerly Twitter). T
Billionaires Discuss Automating Jobs Away in This Week's AI Update Billionaires Discuss Automating Jobs Away in This Week's AI Update Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM Goes Mobile: Your AI-Powered Research Assistant Now on Android & iOSWe’ve been blown away by the response to NotebookLM—millions of users have embraced it as their go-to
comentario (30)
0/200
LarryMitchell
LarryMitchell 12 de abril de 2025 00:00:00 GMT

Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?

GregoryWilson
GregoryWilson 14 de abril de 2025 00:00:00 GMT

ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。

LarryMartin
LarryMartin 11 de abril de 2025 00:00:00 GMT

Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!

JackPerez
JackPerez 12 de abril de 2025 00:00:00 GMT

A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?

EricLewis
EricLewis 12 de abril de 2025 00:00:00 GMT

¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.

GeorgeKing
GeorgeKing 15 de abril de 2025 00:00:00 GMT

Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️

Volver arriba
OR