Podcastle은 450+ AI 음성으로 텍스트 음성 연설을 공개합니다
Podcastle, 팟캐스트 녹음 및 편집으로 유명한 플랫폼, AI 텍스트-음성 변환 게임에 Asyncflow v1.0 모델로 뛰어들었다. 여기서 멈추지 않고 개발자를 위한 API도 출시, 이 기술을 앱에 쉽게 통합할 수 있게 했다.
Asyncflow v1.0으로 Podcastle은 450개 이상의 AI 음성을 제공, 텍스트를 소리 내어 읽는다. 멋진 점? 훈련 및 추론 비용을 낮춰 경쟁에서 우위를 점했다.
Podcastle은 ElevenLabs, Speechify, WellSaid 같은 스타트업과 같은 리그에 합류, 모두 AI를 활용해 텍스트를 음성으로 변환한다. 이 기술은 마케팅, 광고, 콘텐츠 제작, 교육, 직장 내 훈련 등 다양한 분야에 적용된다.
Podcastle의 창립자 Arto Yeritsyan은 TechCrunch에 텍스트-음성 변환에 오랫동안 뛰어들고 싶었다고 밝혔다. 문제는 비용과 데이터 요구량이 너무 컸다는 것. 하지만 최근 대형 언어 모델의 돌파구 덕분에 작년에 마침내 성공했다. "우리는 처음부터 탄탄한 텍스트-음성 모델을 구축하려 했다," Yeritsyan은 말했다. "하지만 비용이 엄청났다. 최신 기술로 우리는 많은 데이터 없이도 최고 수준의 음성 모델을 만들 방법을 찾았다."
작년 1,350만 달러의 시리즈 A 펀딩도 이 프로젝트를 뒷받침했다.
가격 면에서 Podcastle은 경쟁력 있다. 500분 텍스트-음성 변환에 약 40달러를 부과, ElevenLabs는 같은 양에 99달러를 요구한다.
Podcastle의 음성 복제 기능도 개선, 훈련 과정을 훨씬 빠르게 했다. 이전에는 시스템 훈련을 위해 약 70문장을 읽어야 했다. 이제는 몇 초의 음성만으로 충분하다. 작년에 출시한 Magic Dust AI를 사용해 이 새로운 과정에서 오디오 품질을 향상시켰다.

우리가 테스트했을 때 음성은 약간 로봇 같았지만, 톤은 꽤 잘 잡아냈다. Podcastle은 더 나아지도록 노력 중이라고 밝혔다. 다양한 음성 샘플로 시스템을 훈련해 다양한 결과를 얻을 수도 있다.
Podcastle은 비용 절감 외에도 오디오, 비디오 도구, 팟캐스트, AI 내레이션을 한 곳에서 제공하는 것이 경쟁에서 차별화될 것이라고 본다. Yeritsyan은 대부분의 사용자가 오디오 콘텐츠에 집중하지만, 비디오도 점차 주목받고 있다고 언급했다.
관련 기사
구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다
구글 포토는 수요일, 곧 출시될 새로운 AI 기반 기능을 발표했습니다. 이 기능은 사용자의 옷 사진을 디지털 옷장으로 변환해 주어, 새로운 코디를 구성하고 가상으로 입어볼 수도 있게 해줍니다. 이 개념은 영화 ‘클루리스’에서 셰어가 입을 옷을 고르며 수많은 의상들을 둘러보던 그 상징적인 가상 옷장에서 영감을 받은 것이 분명합니다.구글은 이 기능이 AI 기술
Notion, 워크스페이스를 AI 에이전트의 허브로 탈바꿈하다
생산성 소프트웨어 기업 노션(Notion)이 ‘에이전트(agents)’ 시대에 진입하고 있다.수요일 진행된 라이브 스트리밍 제품 발표회에서, 협업형 노트 작성 앱으로 잘 알려진 노션은 자체 AI 에이전트의 기능을 확장하고 외부 에이전트와 연동하며, 팀이 어떤 데이터베이스에서든 데이터를 가져올 수 있는 자동화된 다단계 워크플로를 구축할 수 있게 해주는 새로운
ElevenLabs, 블랙록·제이미 폭스·에바 롱고리아를 신규 투자자로 선정
음성 AI 기업 일레븐랩스(ElevenLabs)는 지난 2월에 처음 발표했던 5억 달러 규모의 시리즈 D 투자 라운드에 참여한 추가 투자자들을 공개했다. 이번 투자자 명단에는 블랙록(BlackRock), 웰링턴(Wellington), D.E. 쇼(D.E. Shaw), 슈로더(Schroders)와 같은 기관 투자자들과 엔비디아(NVIDIA), 세일즈포스(Sa
관련 특별 주제 추천
의견 (31)
0/500
¡Vaya sorpresa con Podcastle! 450+ voces de IA suena a ciencia ficción. Me pregunto cómo afectará esto a los narradores humanos, ¿serán reemplazados o se abrirán nuevas oportunidades creativas? 😮
Podcastle's new text-to-speech with 450+ AI voices is mind-blowing! The variety is insane, but some voices sound a bit robotic. Still, it's a game-changer for podcast creators. Can't wait to see how it evolves! 🚀
¡El nuevo texto a voz de Podcastle con más de 450 voces de IA es impresionante! La variedad es increíble, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los creadores de podcasts. ¡No puedo esperar para ver cómo evoluciona esto! 🚀
Tính năng chuyển văn bản thành giọng nói mới của Podcastle với hơn 450 giọng nói AI thật tuyệt vời! Giọng nói nghe rất tự nhiên, giống như có một người dẫn chuyên nghiệp cho podcast của bạn. Điểm trừ duy nhất là một số giọng nói có thể hơi cứng nhắc, nhưng nhìn chung, đây là công cụ không thể thiếu cho bất kỳ podcaster nào muốn nâng cao trò chơi của mình! 😎
Podcastles neue Text-zu-Sprache-Funktion mit über 450 KI-Stimmen ist der Wahnsinn! Die Stimmen klingen so natürlich, als hätte man einen professionellen Sprecher für sein Podcast. Das einzige Manko sind einige Stimmen, die ein bisschen roboterhaft klingen, aber insgesamt ist es ein Muss für jeden Podcaster, der sein Spiel auf die nächste Stufe heben möchte! 😎
¡El nuevo texto a voz de Podcastle con más de 450 voces de IA es increíble! Las voces suenan tan naturales, es como tener un narrador profesional para tu podcast. Lo único malo es que algunas voces pueden sonar un poco robóticas, pero en general, es una herramienta imprescindible para cualquier podcaster que quiera mejorar su juego. ¡Genial! 😎
Podcastle, 팟캐스트 녹음 및 편집으로 유명한 플랫폼, AI 텍스트-음성 변환 게임에 Asyncflow v1.0 모델로 뛰어들었다. 여기서 멈추지 않고 개발자를 위한 API도 출시, 이 기술을 앱에 쉽게 통합할 수 있게 했다.
Asyncflow v1.0으로 Podcastle은 450개 이상의 AI 음성을 제공, 텍스트를 소리 내어 읽는다. 멋진 점? 훈련 및 추론 비용을 낮춰 경쟁에서 우위를 점했다.
Podcastle은 ElevenLabs, Speechify, WellSaid 같은 스타트업과 같은 리그에 합류, 모두 AI를 활용해 텍스트를 음성으로 변환한다. 이 기술은 마케팅, 광고, 콘텐츠 제작, 교육, 직장 내 훈련 등 다양한 분야에 적용된다.
Podcastle의 창립자 Arto Yeritsyan은 TechCrunch에 텍스트-음성 변환에 오랫동안 뛰어들고 싶었다고 밝혔다. 문제는 비용과 데이터 요구량이 너무 컸다는 것. 하지만 최근 대형 언어 모델의 돌파구 덕분에 작년에 마침내 성공했다. "우리는 처음부터 탄탄한 텍스트-음성 모델을 구축하려 했다," Yeritsyan은 말했다. "하지만 비용이 엄청났다. 최신 기술로 우리는 많은 데이터 없이도 최고 수준의 음성 모델을 만들 방법을 찾았다."
작년 1,350만 달러의 시리즈 A 펀딩도 이 프로젝트를 뒷받침했다.
가격 면에서 Podcastle은 경쟁력 있다. 500분 텍스트-음성 변환에 약 40달러를 부과, ElevenLabs는 같은 양에 99달러를 요구한다.
Podcastle의 음성 복제 기능도 개선, 훈련 과정을 훨씬 빠르게 했다. 이전에는 시스템 훈련을 위해 약 70문장을 읽어야 했다. 이제는 몇 초의 음성만으로 충분하다. 작년에 출시한 Magic Dust AI를 사용해 이 새로운 과정에서 오디오 품질을 향상시켰다.

우리가 테스트했을 때 음성은 약간 로봇 같았지만, 톤은 꽤 잘 잡아냈다. Podcastle은 더 나아지도록 노력 중이라고 밝혔다. 다양한 음성 샘플로 시스템을 훈련해 다양한 결과를 얻을 수도 있다.
Podcastle은 비용 절감 외에도 오디오, 비디오 도구, 팟캐스트, AI 내레이션을 한 곳에서 제공하는 것이 경쟁에서 차별화될 것이라고 본다. Yeritsyan은 대부분의 사용자가 오디오 콘텐츠에 집중하지만, 비디오도 점차 주목받고 있다고 언급했다.
구글 포토, AI로 영화 ‘클루리스’의 상징적인 옷장을 재현하다
구글 포토는 수요일, 곧 출시될 새로운 AI 기반 기능을 발표했습니다. 이 기능은 사용자의 옷 사진을 디지털 옷장으로 변환해 주어, 새로운 코디를 구성하고 가상으로 입어볼 수도 있게 해줍니다. 이 개념은 영화 ‘클루리스’에서 셰어가 입을 옷을 고르며 수많은 의상들을 둘러보던 그 상징적인 가상 옷장에서 영감을 받은 것이 분명합니다.구글은 이 기능이 AI 기술
Notion, 워크스페이스를 AI 에이전트의 허브로 탈바꿈하다
생산성 소프트웨어 기업 노션(Notion)이 ‘에이전트(agents)’ 시대에 진입하고 있다.수요일 진행된 라이브 스트리밍 제품 발표회에서, 협업형 노트 작성 앱으로 잘 알려진 노션은 자체 AI 에이전트의 기능을 확장하고 외부 에이전트와 연동하며, 팀이 어떤 데이터베이스에서든 데이터를 가져올 수 있는 자동화된 다단계 워크플로를 구축할 수 있게 해주는 새로운
ElevenLabs, 블랙록·제이미 폭스·에바 롱고리아를 신규 투자자로 선정
음성 AI 기업 일레븐랩스(ElevenLabs)는 지난 2월에 처음 발표했던 5억 달러 규모의 시리즈 D 투자 라운드에 참여한 추가 투자자들을 공개했다. 이번 투자자 명단에는 블랙록(BlackRock), 웰링턴(Wellington), D.E. 쇼(D.E. Shaw), 슈로더(Schroders)와 같은 기관 투자자들과 엔비디아(NVIDIA), 세일즈포스(Sa
¡Vaya sorpresa con Podcastle! 450+ voces de IA suena a ciencia ficción. Me pregunto cómo afectará esto a los narradores humanos, ¿serán reemplazados o se abrirán nuevas oportunidades creativas? 😮
Podcastle's new text-to-speech with 450+ AI voices is mind-blowing! The variety is insane, but some voices sound a bit robotic. Still, it's a game-changer for podcast creators. Can't wait to see how it evolves! 🚀
¡El nuevo texto a voz de Podcastle con más de 450 voces de IA es impresionante! La variedad es increíble, pero algunas voces suenan un poco robóticas. Aún así, es un cambio de juego para los creadores de podcasts. ¡No puedo esperar para ver cómo evoluciona esto! 🚀
Tính năng chuyển văn bản thành giọng nói mới của Podcastle với hơn 450 giọng nói AI thật tuyệt vời! Giọng nói nghe rất tự nhiên, giống như có một người dẫn chuyên nghiệp cho podcast của bạn. Điểm trừ duy nhất là một số giọng nói có thể hơi cứng nhắc, nhưng nhìn chung, đây là công cụ không thể thiếu cho bất kỳ podcaster nào muốn nâng cao trò chơi của mình! 😎
Podcastles neue Text-zu-Sprache-Funktion mit über 450 KI-Stimmen ist der Wahnsinn! Die Stimmen klingen so natürlich, als hätte man einen professionellen Sprecher für sein Podcast. Das einzige Manko sind einige Stimmen, die ein bisschen roboterhaft klingen, aber insgesamt ist es ein Muss für jeden Podcaster, der sein Spiel auf die nächste Stufe heben möchte! 😎
¡El nuevo texto a voz de Podcastle con más de 450 voces de IA es increíble! Las voces suenan tan naturales, es como tener un narrador profesional para tu podcast. Lo único malo es que algunas voces pueden sonar un poco robóticas, pero en general, es una herramienta imprescindible para cualquier podcaster que quiera mejorar su juego. ¡Genial! 😎





집






