Podcastle revela o texto em fala com mais de 450 vozes de IA
O Podcastle, a plataforma popular da gravação e edição do podcast, está entrando no jogo de texto para fala da IA com seu novo modelo, asyncflow v1.0. Eles não estão apenas parando por aí - eles também estão lançando uma API para desenvolvedores, tornando a brisa conectar essa tecnologia em seus próprios aplicativos.
Com o AsyncFlow v1.0, o Podcastle agora se comporta mais de 450 vozes de IA prontas para ler seu texto em voz alta. A parte legal? Eles conseguiram manter os custos de treinamento e inferência, o que lhes dá uma vantagem na competição.
O Podcastle está agora na mesma liga que outras startups, como Elevenlabs, Spealify e Wellsaid, que estão usando a IA para transformar o texto em palavras faladas. Essa tecnologia tem aplicativos em todo o lugar, desde marketing e anúncios a fazer conteúdo, ensino e até treinar pessoas no trabalho.
Arto Yeritsyan, o cérebro por trás do Podcastle, disse ao TechCrunch que eles estão querendo mergulhar no texto em fala há um tempo. O problema? Era muito caro e faminto por dados. Mas, graças a alguns avanços recentes em grandes modelos de idiomas, eles finalmente quebraram o código no ano passado. "Temos como objetivo construir um modelo sólido de texto para fala desde o início", disse Yeritsyan. "Mas os custos eram altíssimos. Com a última tecnologia, encontramos uma maneira de criar um modelo de voz de alto nível sem precisar de uma montanha de dados".
Seu angariação de fundos da Série A de US $ 13,5 milhões no ano passado também ajudou a alimentar esse projeto.
Quando se trata de preços, o Podcastle é bastante competitivo. Eles estão cobrando cerca de US $ 40 por 500 minutos de conversão de texto em fala, enquanto o Elevenlabs pede US $ 99 pelo mesmo valor.
O recurso de clonagem de voz do Podcastle também está recebendo um facelift, tornando o processo de treinamento muito mais rápido. Antes, você tinha que ler cerca de 70 frases para treinar o sistema. Agora, leva apenas alguns segundos da sua voz. Eles estão usando sua AI de poeira mágica, que lançaram no ano passado, para aumentar a qualidade do áudio durante esse novo processo.

Quando tentamos sair, a voz parecia um pouco robótica, mas conquistou nosso tom muito bem. O Podcastle diz que está trabalhando para torná -lo ainda melhor. Você também pode treinar o sistema com amostras de voz diferentes para obter resultados variados.
O Podcastle acha que, além de manter os custos baixos, ter tudo, desde ferramentas de áudio e vídeo a podcasts e narração de IA em um só lugar, os diferenciará da competição. Yeritsyan mencionou que, embora a maioria dos usuários se atenha ao conteúdo de áudio, o vídeo também está começando a ganhar terreno.
Artigo relacionado
xAI posts Grok’s behind-the-scenes prompts
xAI Releases Grok's System Prompts After Controversial "White Genocide" ResponsesIn an unexpected move, xAI has decided to publicly share the system prompts for its AI chatbot Grok after an incident where the bot began generating unprompted responses about "white genocide" on X (formerly Twitter). T
Billionaires Discuss Automating Jobs Away in This Week's AI Update
Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere
NotebookLM Goes Mobile: Your AI-Powered Research Assistant Now on Android & iOSWe’ve been blown away by the response to NotebookLM—millions of users have embraced it as their go-to
Comentários (30)
0/200
LarryMitchell
12 de Abril de 2025 à0 00:00:00 GMT
Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?
0
GregoryWilson
14 de Abril de 2025 à0 00:00:00 GMT
ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。
0
LarryMartin
11 de Abril de 2025 à0 00:00:00 GMT
Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!
0
JackPerez
12 de Abril de 2025 à0 00:00:00 GMT
A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?
0
EricLewis
12 de Abril de 2025 à0 00:00:00 GMT
¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.
0
GeorgeKing
15 de Abril de 2025 à0 00:00:00 GMT
Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️
0
O Podcastle, a plataforma popular da gravação e edição do podcast, está entrando no jogo de texto para fala da IA com seu novo modelo, asyncflow v1.0. Eles não estão apenas parando por aí - eles também estão lançando uma API para desenvolvedores, tornando a brisa conectar essa tecnologia em seus próprios aplicativos.
Com o AsyncFlow v1.0, o Podcastle agora se comporta mais de 450 vozes de IA prontas para ler seu texto em voz alta. A parte legal? Eles conseguiram manter os custos de treinamento e inferência, o que lhes dá uma vantagem na competição.
O Podcastle está agora na mesma liga que outras startups, como Elevenlabs, Spealify e Wellsaid, que estão usando a IA para transformar o texto em palavras faladas. Essa tecnologia tem aplicativos em todo o lugar, desde marketing e anúncios a fazer conteúdo, ensino e até treinar pessoas no trabalho.
Arto Yeritsyan, o cérebro por trás do Podcastle, disse ao TechCrunch que eles estão querendo mergulhar no texto em fala há um tempo. O problema? Era muito caro e faminto por dados. Mas, graças a alguns avanços recentes em grandes modelos de idiomas, eles finalmente quebraram o código no ano passado. "Temos como objetivo construir um modelo sólido de texto para fala desde o início", disse Yeritsyan. "Mas os custos eram altíssimos. Com a última tecnologia, encontramos uma maneira de criar um modelo de voz de alto nível sem precisar de uma montanha de dados".
Seu angariação de fundos da Série A de US $ 13,5 milhões no ano passado também ajudou a alimentar esse projeto.
Quando se trata de preços, o Podcastle é bastante competitivo. Eles estão cobrando cerca de US $ 40 por 500 minutos de conversão de texto em fala, enquanto o Elevenlabs pede US $ 99 pelo mesmo valor.
O recurso de clonagem de voz do Podcastle também está recebendo um facelift, tornando o processo de treinamento muito mais rápido. Antes, você tinha que ler cerca de 70 frases para treinar o sistema. Agora, leva apenas alguns segundos da sua voz. Eles estão usando sua AI de poeira mágica, que lançaram no ano passado, para aumentar a qualidade do áudio durante esse novo processo.
Quando tentamos sair, a voz parecia um pouco robótica, mas conquistou nosso tom muito bem. O Podcastle diz que está trabalhando para torná -lo ainda melhor. Você também pode treinar o sistema com amostras de voz diferentes para obter resultados variados.
O Podcastle acha que, além de manter os custos baixos, ter tudo, desde ferramentas de áudio e vídeo a podcasts e narração de IA em um só lugar, os diferenciará da competição. Yeritsyan mencionou que, embora a maioria dos usuários se atenha ao conteúdo de áudio, o vídeo também está começando a ganhar terreno.




Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?




ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。




Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!




A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?




¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.




Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️












