lựa chọn
Trang chủ
Tin tức
Podcastle tiết lộ văn bản-to-Speech với 450+ giọng nói AI

Podcastle tiết lộ văn bản-to-Speech với 450+ giọng nói AI

Ngày 10 tháng 4 năm 2025
114

Podcastle, nền tảng phổ biến để ghi và chỉnh sửa podcast, đang nhảy vào trò chơi Text Text-Teche với mô hình mới của nó, Asyncflow v1.0. Họ không chỉ dừng lại ở đó, họ còn đưa ra một API cho các nhà phát triển, khiến cho việc cắm công nghệ này vào các ứng dụng của họ.

Với Asyncflow v1.0, Podcastle hiện đang tự hào với hơn 450 giọng nói AI đã sẵn sàng để đọc to văn bản của bạn. Phần mát mẻ? Họ đã quản lý để giảm chi phí đào tạo và suy luận, điều này mang lại cho họ một bước chân trong cuộc thi.

Podcastle hiện đang ở trong cùng một giải đấu với các công ty khởi nghiệp khác như Elevenlabs, Spreamify và Wellsaid, tất cả đều đang sử dụng AI để biến văn bản thành những từ được nói. Công nghệ này có các ứng dụng ở khắp mọi nơi, từ tiếp thị và quảng cáo đến tạo nội dung, giảng dạy và thậm chí đào tạo mọi người tại nơi làm việc.

Arto Yeritsyan, bộ não đằng sau Podcastle, nói với TechCrunch rằng họ đã muốn đi sâu vào văn bản thành lời nói trong một thời gian. Vấn đề? Nó chỉ là quá đắt và đói dữ liệu. Nhưng nhờ một số đột phá gần đây trong các mô hình ngôn ngữ lớn, cuối cùng họ đã bẻ khóa mã năm ngoái. "Chúng tôi đã nhắm đến việc xây dựng một mô hình văn bản thành giọng nói vững chắc ngay từ đầu," Yeritsyan nói. "Nhưng các chi phí rất cao. Với công nghệ mới nhất, chúng tôi đã tìm ra cách tạo ra một mô hình giọng nói hàng đầu mà không cần một núi dữ liệu."

F gây quỹ Series A năm ngoái trị giá 13,5 triệu đô la của họ năm ngoái cũng đã giúp thúc đẩy dự án này.

Khi nói đến giá cả, Podcastle khá cạnh tranh. Họ đang tính phí khoảng 40 đô la trong 500 phút chuyển đổi văn bản thành giọng nói, trong khi Elevenlabs yêu cầu 99 đô la cho cùng một số tiền.

Tính năng nhân bản bằng giọng nói của Podcastle cũng đang thay đổi, làm cho quá trình đào tạo nhanh hơn rất nhiều. Trước đây, bạn phải đọc ra khoảng 70 câu để đào tạo hệ thống. Bây giờ, chỉ mất vài giây giọng nói của bạn. Họ đang sử dụng AI Magic Dust, mà họ đã ra mắt vào năm ngoái, để tăng chất lượng âm thanh trong quá trình mới này.

Tín dụng hình ảnh: Podcastle

Khi chúng tôi dùng thử, giọng nói có vẻ hơi robot, nhưng nó đã bắt được giai điệu của chúng tôi khá tốt. Podcastle cho biết họ đang làm việc để làm cho nó thậm chí còn tốt hơn. Bạn cũng có thể đào tạo hệ thống với các mẫu giọng nói khác nhau để có kết quả khác nhau.

Podcastle cho rằng, ngoài việc giữ chi phí thấp, có mọi thứ, từ các công cụ âm thanh và video đến podcast và tường thuật AI ở một nơi sẽ khiến chúng khác biệt với cuộc thi. Yeritsyan đã đề cập rằng trong khi hầu hết người dùng tuân thủ nội dung âm thanh, video cũng bắt đầu có được chỗ đứng.

Bài viết liên quan
xAI posts Grok’s behind-the-scenes prompts xAI posts Grok’s behind-the-scenes prompts xAI Releases Grok's System Prompts After Controversial "White Genocide" ResponsesIn an unexpected move, xAI has decided to publicly share the system prompts for its AI chatbot Grok after an incident where the bot began generating unprompted responses about "white genocide" on X (formerly Twitter). T
Billionaires Discuss Automating Jobs Away in This Week's AI Update Billionaires Discuss Automating Jobs Away in This Week's AI Update Hey everyone, welcome back to TechCrunch's AI newsletter! If you're not already subscribed, you can sign up here to get it delivered straight to your inbox every Wednesday.We took a little break last week, but for good reason—the AI news cycle was on fire, thanks in large part to the sudden surge of
NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM App Launches: AI-Powered Tool for Instant Knowledge Access Anywhere NotebookLM Goes Mobile: Your AI-Powered Research Assistant Now on Android & iOSWe’ve been blown away by the response to NotebookLM—millions of users have embraced it as their go-to
Nhận xét (30)
0/200
LarryMitchell
LarryMitchell 00:00:00 GMT Ngày 12 tháng 4 năm 2025

Podcastle's new text-to-speech feature is pretty cool! With over 450 voices, it's like having a whole choir at your fingertips. The API integration is smooth, but some voices sound a bit robotic. Still, it's a game-changer for podcasters. Keep up the good work, but maybe work on making the voices more natural?

GregoryWilson
GregoryWilson 00:00:00 GMT Ngày 14 tháng 4 năm 2025

ポッドキャッスルのテキスト読み上げ機能、すごく便利!450以上の声から選べるなんて夢のよう。APIも使いやすいけど、少しロボットっぽい声が気になるかな。でもポッドキャスターには革命的だよ。これからも頑張って、もっと自然な声に改良してほしいな。

LarryMartin
LarryMartin 00:00:00 GMT Ngày 11 tháng 4 năm 2025

Podcastle의 새로운 텍스트 음성 변환 기능 정말 좋아요! 450개가 넘는 목소리를 선택할 수 있다니, 정말 대단해요. API도 사용하기 쉽지만, 몇몇 목소리는 로봇 같아요. 그래도 팟캐스터들에게는 혁신적이에요. 계속해서 좋은 일 하세요, 목소리를 더 자연스럽게 개선해 주세요!

JackPerez
JackPerez 00:00:00 GMT Ngày 12 tháng 4 năm 2025

A nova função de texto para fala do Podcastle é incrível! Com mais de 450 vozes, parece que você tem um coro inteiro à sua disposição. A integração da API é suave, mas algumas vozes soam um pouco robóticas. Ainda assim, é uma mudança de jogo para podcasters. Continuem o bom trabalho, mas talvez trabalhem para tornar as vozes mais naturais?

EricLewis
EricLewis 00:00:00 GMT Ngày 12 tháng 4 năm 2025

¡La nueva función de texto a voz de Podcastle es genial! Con más de 450 voces, es como tener un coro entero a tu disposición. La integración de la API es suave, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los podcasters. Sigan con el buen trabajo, pero quizás trabajen en hacer las voces más naturales.

GeorgeKing
GeorgeKing 00:00:00 GMT Ngày 15 tháng 4 năm 2025

Podcastle's new text-to-speech feature with 450+ voices is mind-blowing! The voices sound so natural, it's hard to believe they're AI. The only downside is the API setup can be a bit tricky, but overall, it's a game-changer for podcasters! 🎙️

Quay lại đầu
OR