Подкаст открывает текст в речь с 450+ голосами AI
Подкаст, популярная платформа для записи и редактирования подкастов, прыгает в игру Text-To Speek с новой моделью Asyncflow V1.0. Они не просто останавливаются там - они также развертывают API для разработчиков, что делает его бризом, чтобы подключить эту технологию к своим приложениям.
С Asyncflow v1.0 подкаст теперь может похвастаться более чем 450 голосами AI, готовых читать ваш текст вслух. Крутая часть? Им удалось снизить затраты на обучение и вывод, что дает им поддержку конкуренции.
Подкаст сейчас находится в той же лиге, что и другие стартапы, такие как ElevenLabs, Speeringify и Wellsaid, все из которых используют ИИ, чтобы превратить текст в произнесенные слова. Эта технология имеет приложения повсюду, от маркетинга и рекламы до создания контента, преподавания и даже обучения людей на работе.
Арто Ерицьян, мозг, стоящий за подкастом, сказал TechCrunch, что они хотели немного погрузиться в речь текста в речь. Проблема? Это было просто слишком дорого и жаждет данных. Но благодаря некоторым недавним прорывам в крупных языковых моделях, они наконец взломали код в прошлом году. «Мы с самого начала стремились создать твердую модель текста в речь»,-сказал Ерицьян. «Но затраты были высокими. С новейшей технологией мы нашли способ создать первокласную голосовую модель без необходимости горы данных».
Их сбор средств в размере 13,5 млн. Долл. США в прошлом году также помог разжечь этот проект.
Когда дело доходит до цен, подкаст довольно конкурентоспособен. Они взимают около 40 долларов США за 500 минут конверсии текста в речь, в то время как ElevenLabs просит 99 долларов за ту же сумму.
Функция голосового клонирования подкаста также получает подтяжку лица, что делает процесс обучения намного быстрее. Раньше вам приходилось зачитать около 70 предложений, чтобы обучить систему. Теперь это займет всего несколько секунд вашего голоса. Они используют свой AI Magic Dust, который они запустили в прошлом году, для повышения качества звука во время этого нового процесса.

Когда мы попробовали это, голос звучал немного роботизированным, но он очень хорошо уловил наш тон. Подкасл говорит, что они работают над тем, чтобы сделать его еще лучше. Вы также можете обучить систему различным голосовым образцам, чтобы получить различные результаты.
Подкаст считает, что, помимо того, что затраты на низкие затраты, наличие всего, от аудио и видео инструментов до подкастов и повествования искусственного интеллекта в одном месте, отличит их от конкуренции. Ерицьян упомянул, что, хотя большинство пользователей придерживаются аудиоконтента, видео также начинает набирать оболочку.
Связанная статья
xAI posts Grok’s behind-the-scenes prompts
xAI Releases Grok's System Prompts After Controversial "White Genocide" ResponsesIn an unexpected move, xAI has decided to publicly share the system prompts for its AI chatbot Grok after an incident where the bot began generating unprompted responses about "white genocide" on X (formerly Twitter). T
Billionaires Discuss Automating Jobs Away in This Week's AI Update
Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere
NotebookLM Goes Mobile: Your AI-Powered Research Assistant Now on Android & iOSWe’ve been blown away by the response to NotebookLM—millions of users have embraced it as their go-to
Комментарии (30)
LarryMitchell
12 апреля 2025 г., 0:00:00 GMT
Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?
0
GregoryWilson
14 апреля 2025 г., 0:00:00 GMT
ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。
0
LarryMartin
11 апреля 2025 г., 0:00:00 GMT
Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!
0
JackPerez
12 апреля 2025 г., 0:00:00 GMT
A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?
0
EricLewis
12 апреля 2025 г., 0:00:00 GMT
¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.
0
GeorgeKing
15 апреля 2025 г., 0:00:00 GMT
Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️
0
Подкаст, популярная платформа для записи и редактирования подкастов, прыгает в игру Text-To Speek с новой моделью Asyncflow V1.0. Они не просто останавливаются там - они также развертывают API для разработчиков, что делает его бризом, чтобы подключить эту технологию к своим приложениям.
С Asyncflow v1.0 подкаст теперь может похвастаться более чем 450 голосами AI, готовых читать ваш текст вслух. Крутая часть? Им удалось снизить затраты на обучение и вывод, что дает им поддержку конкуренции.
Подкаст сейчас находится в той же лиге, что и другие стартапы, такие как ElevenLabs, Speeringify и Wellsaid, все из которых используют ИИ, чтобы превратить текст в произнесенные слова. Эта технология имеет приложения повсюду, от маркетинга и рекламы до создания контента, преподавания и даже обучения людей на работе.
Арто Ерицьян, мозг, стоящий за подкастом, сказал TechCrunch, что они хотели немного погрузиться в речь текста в речь. Проблема? Это было просто слишком дорого и жаждет данных. Но благодаря некоторым недавним прорывам в крупных языковых моделях, они наконец взломали код в прошлом году. «Мы с самого начала стремились создать твердую модель текста в речь»,-сказал Ерицьян. «Но затраты были высокими. С новейшей технологией мы нашли способ создать первокласную голосовую модель без необходимости горы данных».
Их сбор средств в размере 13,5 млн. Долл. США в прошлом году также помог разжечь этот проект.
Когда дело доходит до цен, подкаст довольно конкурентоспособен. Они взимают около 40 долларов США за 500 минут конверсии текста в речь, в то время как ElevenLabs просит 99 долларов за ту же сумму.
Функция голосового клонирования подкаста также получает подтяжку лица, что делает процесс обучения намного быстрее. Раньше вам приходилось зачитать около 70 предложений, чтобы обучить систему. Теперь это займет всего несколько секунд вашего голоса. Они используют свой AI Magic Dust, который они запустили в прошлом году, для повышения качества звука во время этого нового процесса.
Когда мы попробовали это, голос звучал немного роботизированным, но он очень хорошо уловил наш тон. Подкасл говорит, что они работают над тем, чтобы сделать его еще лучше. Вы также можете обучить систему различным голосовым образцам, чтобы получить различные результаты.
Подкаст считает, что, помимо того, что затраты на низкие затраты, наличие всего, от аудио и видео инструментов до подкастов и повествования искусственного интеллекта в одном месте, отличит их от конкуренции. Ерицьян упомянул, что, хотя большинство пользователей придерживаются аудиоконтента, видео также начинает набирать оболочку.




Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?




ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。




Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!




A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?




¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.




Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️












