विकल्प
घर
समाचार
पॉडकास्टल ने 450+ एआई आवाज़ों के साथ टेक्स्ट-टू-स्पीच का अनावरण किया

पॉडकास्टल ने 450+ एआई आवाज़ों के साथ टेक्स्ट-टू-स्पीच का अनावरण किया

10 अप्रैल 2025
114

पॉडकास्ट रिकॉर्डिंग और संपादन के लिए लोकप्रिय मंच पॉडकास्टल, अपने नए मॉडल, Asyncflow V1.0 के साथ AI टेक्स्ट-टू-स्पीच गेम में कूद रहा है। वे केवल वहां रुक नहीं रहे हैं - वे डेवलपर्स के लिए एक एपीआई भी रोल कर रहे हैं, जिससे इस तकनीक को अपने स्वयं के ऐप में प्लग करने के लिए एक हवा बन जाती है।

Asyncflow v1.0 के साथ, Podcastle ने अब 450 से अधिक AI आवाज़ों को अपने पाठ को ज़ोर से पढ़ने के लिए तैयार किया है। शांत हिस्सा? वे प्रशिक्षण और अनुमान लागत को कम रखने में कामयाब रहे हैं, जो उन्हें प्रतियोगिता में एक पैर देता है।

पॉडकास्टल अब एक ही लीग में है जैसे कि अन्य स्टार्टअप जैसे कि अन्य स्टार्टअप्स, स्पीचिफाई, और वेलसैड, जो सभी एआई का उपयोग टेक्स्ट को बोले गए शब्दों में बदलने के लिए कर रहे हैं। इस तकनीक ने सभी जगह आवेदन प्राप्त किए हैं, विपणन और विज्ञापनों से लेकर सामग्री, शिक्षण और यहां तक ​​कि काम पर लोगों को प्रशिक्षित करने तक।

पॉडकास्टल के पीछे दिमाग, आर्टो येरिट्सियन ने टेकक्रंच को बताया कि वे कुछ समय के लिए पाठ-से-भाषण में गोता लगाना चाहते हैं। समस्या? यह सिर्फ बहुत महंगा और डेटा-भूखा था। लेकिन बड़े भाषा मॉडल में कुछ हालिया सफलताओं के लिए धन्यवाद, उन्होंने आखिरकार पिछले साल कोड को क्रैक किया। "हम शुरू से ही एक ठोस टेक्स्ट-टू-स्पीच मॉडल बनाने का लक्ष्य बना रहे हैं," येरित्सियन ने कहा। "लेकिन लागत आकाश-उच्च थी। नवीनतम तकनीक के साथ, हमने डेटा के पहाड़ की आवश्यकता के बिना एक शीर्ष पायदान वॉयस मॉडल बनाने का एक तरीका खोजा।"

पिछले साल उनकी $ 13.5 मिलियन की श्रृंखला ए फंड्रेज़ ने भी इस परियोजना को ईंधन देने में मदद की।

जब मूल्य निर्धारण की बात आती है, तो पॉडकास्टल की बहुत प्रतिस्पर्धी। वे पाठ-से-भाषण रूपांतरण के 500 मिनट के लिए $ 40 के आसपास चार्ज कर रहे हैं, जबकि ElevenLabs उसी राशि के लिए $ 99 के लिए पूछते हैं।

पॉडकास्टल की वॉयस क्लोनिंग फीचर को एक फेसलिफ्ट भी मिल रहा है, जिससे प्रशिक्षण प्रक्रिया पूरी तरह से तेज हो जाती है। इससे पहले, आपको सिस्टम को प्रशिक्षित करने के लिए लगभग 70 वाक्यों को पढ़ना था। अब, यह केवल आपकी आवाज के कुछ सेकंड लेता है। वे अपने मैजिक डस्ट एआई का उपयोग कर रहे हैं, जिसे उन्होंने पिछले साल लॉन्च किया था, इस नई प्रक्रिया के दौरान ऑडियो गुणवत्ता को बढ़ावा देने के लिए।

छवि क्रेडिट: पॉडकास्टल

जब हमने इसे आज़माया, तो आवाज थोड़ी रोबोट लग रही थी, लेकिन इसने हमारे टोन को बहुत अच्छी तरह से पकड़ लिया। पॉडकास्टल का कहना है कि वे इसे और बेहतर बनाने पर काम कर रहे हैं। आप विभिन्न परिणामों को प्राप्त करने के लिए विभिन्न आवाज के नमूनों के साथ सिस्टम को प्रशिक्षित कर सकते हैं।

पॉडकास्टल ने कहा कि, लागत कम रखने से अलग, ऑडियो और वीडियो टूल से लेकर पॉडकास्ट तक सब कुछ होने और एक स्थान पर एआई कथन उन्हें प्रतियोगिता से अलग कर देगा। येरिट्सियन ने उल्लेख किया कि जबकि अधिकांश उपयोगकर्ता ऑडियो सामग्री से चिपके रहते हैं, वीडियो को भी जमीन हासिल करना शुरू कर दिया जाता है।

संबंधित लेख
xAI posts Grok’s behind-the-scenes prompts xAI posts Grok’s behind-the-scenes prompts xAI Releases Grok's System Prompts After Controversial "White Genocide" ResponsesIn an unexpected move, xAI has decided to publicly share the system prompts for its AI chatbot Grok after an incident where the bot began generating unprompted responses about "white genocide" on X (formerly Twitter). T
Billionaires Discuss Automating Jobs Away in This Week's AI Update Billionaires Discuss Automating Jobs Away in This Week's AI Update Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM Goes Mobile: Your AI-Powered Research Assistant Now on Android & iOSWe’ve been blown away by the response to NotebookLM—millions of users have embraced it as their go-to
सूचना (30)
LarryMitchell
LarryMitchell 12 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?

GregoryWilson
GregoryWilson 14 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。

LarryMartin
LarryMartin 11 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!

JackPerez
JackPerez 12 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?

EricLewis
EricLewis 12 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.

GeorgeKing
GeorgeKing 15 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️

शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है 2025 के शीर्ष AI वीडियो जनरेटर: Pika Labs बनाम विकल्प GEMINI 2.5 प्रो अब असीमित और सस्ता क्लाउड की तुलना में सस्ता, GPT-4O एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें दक्षिण कोरिया स्थानीय दुकानों में दीपसेक ऐप डाउनलोड करता है
अधिक
शीर्ष पर वापस
OR