option
Maison
Nouvelles
Podcastle dévoile du texte à la dissection avec plus de 450 voix d'IA

Podcastle dévoile du texte à la dissection avec plus de 450 voix d'IA

10 avril 2025
114

Podcastle, la plate-forme populaire pour l'enregistrement et l'édition de podcast, saute dans le jeu de texte-vocation AI avec son nouveau modèle, AsyncFlow v1.0. Ils ne s'arrêtent pas seulement là - ils déploient également une API pour les développeurs, ce qui rend un jeu d'enfant pour brancher cette technologie sur leurs propres applications.

Avec AsyncFlow v1.0, Podcastle se vante désormais de 450 voix d'IA prêtes à lire votre texte à haute voix. La partie cool? Ils ont réussi à réduire les coûts de formation et d'inférence, ce qui leur donne une longueur d'avance sur la concurrence.

Podcastle est maintenant dans la même ligue que les autres startups comme ElevenLabs, Speakify et Wellsaid, qui utilisent toutes l'IA pour transformer le texte en mots prononcés. Cette technologie a des applications partout, du marketing et des publicités à la création de contenu, à l'enseignement et même à la formation de gens au travail.

Arto Yeritsyan, le Brains Behind Podcastle, a déclaré à TechCrunch qu'ils voulaient plonger dans du texte vocale depuis un certain temps maintenant. Le problème? C'était tout simplement trop cher et avide de données. Mais grâce à certaines percées récentes dans des modèles de grands langues, ils ont finalement craqué le code l'année dernière. "Nous avons visé à construire un modèle de texte vocal solide dès le début", a déclaré Yeritsyan. "Mais les coûts étaient très élevés. Avec les dernières technologies, nous avons trouvé un moyen de créer un modèle vocal de premier ordre sans avoir besoin d'une montagne de données."

L'année dernière, leur collecte de fonds de 13,5 millions de dollars a également contribué à alimenter ce projet.

En ce qui concerne les prix, Podcastle est assez compétitif. Ils facturent environ 40 $ pour 500 minutes de conversion de texte végétal, tandis qu'ElevenLabs demande 99 $ pour le même montant.

La fonction de clonage vocale de Podcastle obtient également un lifting, ce qui rend le processus de formation beaucoup plus rapide. Avant, vous deviez lire environ 70 phrases pour former le système. Maintenant, cela ne prend que quelques secondes de votre voix. Ils utilisent leur Magic Dust AI, qu'ils ont lancé l'année dernière, pour augmenter la qualité audio au cours de ce nouveau processus.

Crédits d'image: podcastle

Lorsque nous l'avons essayé, la voix sonnait un peu robotique, mais elle a assez bien pris le ton. Podcastle dit qu'ils travaillent à le rendre encore meilleur. Vous pouvez également former le système avec différents échantillons de voix pour obtenir des résultats variés.

Podcastle estime que, en plus de maintenir les coûts bas, tout, des outils audio et vidéo aux podcasts et à la narration de l'IA en un seul endroit les distinguera de la concurrence. Yeritsyan a mentionné que si la plupart des utilisateurs s'en tiennent au contenu audio, la vidéo commence également à gagner du terrain.

Article connexe
xAI posts Grok’s behind-the-scenes prompts xAI posts Grok’s behind-the-scenes prompts xAI Releases Grok's System Prompts After Controversial "White Genocide" ResponsesIn an unexpected move, xAI has decided to publicly share the system prompts for its AI chatbot Grok after an incident where the bot began generating unprompted responses about "white genocide" on X (formerly Twitter). T
Billionaires Discuss Automating Jobs Away in This Week's AI Update Billionaires Discuss Automating Jobs Away in This Week's AI Update Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM Goes Mobile: Your AI-Powered Research Assistant Now on Android & iOSWe’ve been blown away by the response to NotebookLM—millions of users have embraced it as their go-to
commentaires (30)
0/200
LarryMitchell
LarryMitchell 12 avril 2025 00:00:00 UTC

Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?

GregoryWilson
GregoryWilson 14 avril 2025 00:00:00 UTC

ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。

LarryMartin
LarryMartin 11 avril 2025 00:00:00 UTC

Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!

JackPerez
JackPerez 12 avril 2025 00:00:00 UTC

A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?

EricLewis
EricLewis 12 avril 2025 00:00:00 UTC

¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.

GeorgeKing
GeorgeKing 15 avril 2025 00:00:00 UTC

Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️

Retour en haut
OR