AI는 인디언이 Krisp와의 전화로 미국인들을 돕습니다
수요일, 오디오 스타트업 Krisp는 통화 중 사용자의 억양을 변경하는 AI를 활용한 획기적인 기능을 공개했습니다. 초기에는 인도 영어 억양을 미국 영어로 변환하는 데 초점을 맞췄습니다.
Krisp에 따르면, 억양 변환 기술은 원래 화자의 목소리를 유지하며, 미국 억양에 맞게 음소만 수정합니다. 이 기능은 기업 환경에서 시범 운영된 후, 이제 Krisp 데스크톱 애플리케이션에서 베타 단계에 들어섰습니다. 사용자는 통화 전이나 통화 중 언제든지 이 기능을 활성화할 수 있는 유연성을 갖습니다.
Krisp의 공동 창립자 Arto Minasyan은 이 혁신의 영감을 자신의 경험에서 얻었다고 밝혔습니다. "많은 사람들이 제가 영어를 잘해도 제 억양을 이해하는 데 어려움을 겪습니다. 억양을 변경함으로써 의사소통을 크게 개선할 수 있다고 믿었습니다. 우리는 2년 동안 이 솔루션을 개발해왔으며, 베타 버전으로 출시하게 되어 기쁩니다,"라고 Minasyan은 설명했습니다.
그러나 이 기능을 테스트하는 동안, 처리된 음성은 다소 부자연스럽게 들렸으며, 때때로 단어가 생략되었습니다. Krisp는 이러한 문제를 베타 단계의 일부로 인정하며, 모델이 시간이 지나면서 발전하고 개선될 것이라고 사용자들에게 확신시켰습니다.
Krisp는 기업 시범 운영에서 이 기능이 판매 전환율을 26.1% 증가시키고 예약당 수익을 14.8% 증가시켰다고 보고했습니다.

이미지 제공:Krisp.ai 인도 억양을 먼저 시작한 결정은 글로벌 STEM 분야에서 인도 전문가들의 큰 비중 때문이었습니다. Krisp는 향후 필리핀 억양 및 더 많은 억양을 지원할 계획입니다.GV가 지원하는 Sanas와 같은 다른 스타트업은 이미 콜센터에서 유사한 기술을 대규모로 구현했습니다.
회사는 사용자 동의를 받아 회의 어시스턴트에서 얻은 데이터를 사용해 다양한 억양과 방언을 나타내는 수천 개의 음성 샘플로 모델을 훈련시켰습니다.
Minasyan은 이 기능의 또 다른 이점을 강조했습니다. 사용자의 음성에 대한 사전 훈련이 필요 없으며, 실시간으로 화자 프로필을 동적으로 생성합니다.
2021년에 마지막으로 자금을 조달한 Krisp는 올해 말 iOS 및 Android 앱을 출시하여 대면 회의를 강화할 예정입니다. 또한 Google Meet과의 통합을 개선하기 위해 새로운 Chrome 확장 프로그램을 개발 중입니다.
관련 기사
ElevenLabs, 블랙록·제이미 폭스·에바 롱고리아를 신규 투자자로 선정
음성 AI 기업 일레븐랩스(ElevenLabs)는 지난 2월에 처음 발표했던 5억 달러 규모의 시리즈 D 투자 라운드에 참여한 추가 투자자들을 공개했다. 이번 투자자 명단에는 블랙록(BlackRock), 웰링턴(Wellington), D.E. 쇼(D.E. Shaw), 슈로더(Schroders)와 같은 기관 투자자들과 엔비디아(NVIDIA), 세일즈포스(Sa
텍스트 번역으로 유명한 DeepL이 이제 음성 번역 시장에 진출한다
텍스트 기반 도구로 잘 알려진 번역 기업 DeepL이 오늘, 맞춤형 애플리케이션을 통해 현장 근무자들을 위한 회의, 모바일 및 웹 대화, 그룹 토론 등의 상황을 지원하는 음성-음성 번역 제품군을 출시했습니다. 또한 이 회사는 외부 개발자와 기업들이 콜센터와 같은 맞춤형 사용 사례를 위해 DeepL의 기술을 기반으로 서비스를 구축할 수 있도록 지원하는 API
미스트랄, 오픈소스 음성 생성 모델 공개
프랑스의 AI 기업 미스트랄(Mistral)은 목요일, 음성 AI 비서 및 고객 지원과 같은 기업용 애플리케이션을 위해 설계된 새로운 오픈소스 텍스트-투-스피치(TTS) 모델을 공개했다. 이 모델을 통해 기업들은 영업 및 고객 소통을 위한 음성 에이전트를 구축할 수 있게 되었으며, 미스트랄은 이를 통해 일레븐랩스(ElevenLabs), 딥그램(Deepgra
관련 특별 주제 추천
의견 (48)
0/500
오늘 AI로 억양 변환하는 기술 기사 읽었는데요. 우리나라에서도 한참 영어 발음 걱정하는 사람들 많은데, 이 기술이 한국인 억양도 분석해줄 수 있을까요? 한국 영어교육 시장에 적용되면 진짜 대박 날 거 같은데... 🤔 그런데 미국식 억양이 ‘표준’이라는 가정 자체가 좀 불편하네요.
Je trouve ça un peu inquiétant ce besoin de gommer les accents régionaux pour correspondre à une norme... L'intelligence artificielle devrait-elle vraiment servir à uniformiser nos identités culturelles au lieu de nous aider à mieux nous comprendre mutuellement ? 😕
This AI accent switch is wild! It’s like giving your voice a Hollywood makeover in real-time. I wonder how it handles regional Indian accents—pretty cool for call centers, but does it make everyone sound like a generic American newscaster? 😄
La nueva función de IA de Krisp para sonar americano es alucinante. Es genial cambiar de acento en las llamadas, pero es raro perder mi acento indio. Es útil para el trabajo, pero espero que no nos haga sonar todos iguales. 🤔
수요일, 오디오 스타트업 Krisp는 통화 중 사용자의 억양을 변경하는 AI를 활용한 획기적인 기능을 공개했습니다. 초기에는 인도 영어 억양을 미국 영어로 변환하는 데 초점을 맞췄습니다.
Krisp에 따르면, 억양 변환 기술은 원래 화자의 목소리를 유지하며, 미국 억양에 맞게 음소만 수정합니다. 이 기능은 기업 환경에서 시범 운영된 후, 이제 Krisp 데스크톱 애플리케이션에서 베타 단계에 들어섰습니다. 사용자는 통화 전이나 통화 중 언제든지 이 기능을 활성화할 수 있는 유연성을 갖습니다.
Krisp의 공동 창립자 Arto Minasyan은 이 혁신의 영감을 자신의 경험에서 얻었다고 밝혔습니다. "많은 사람들이 제가 영어를 잘해도 제 억양을 이해하는 데 어려움을 겪습니다. 억양을 변경함으로써 의사소통을 크게 개선할 수 있다고 믿었습니다. 우리는 2년 동안 이 솔루션을 개발해왔으며, 베타 버전으로 출시하게 되어 기쁩니다,"라고 Minasyan은 설명했습니다.
그러나 이 기능을 테스트하는 동안, 처리된 음성은 다소 부자연스럽게 들렸으며, 때때로 단어가 생략되었습니다. Krisp는 이러한 문제를 베타 단계의 일부로 인정하며, 모델이 시간이 지나면서 발전하고 개선될 것이라고 사용자들에게 확신시켰습니다.
Krisp는 기업 시범 운영에서 이 기능이 판매 전환율을 26.1% 증가시키고 예약당 수익을 14.8% 증가시켰다고 보고했습니다.

GV가 지원하는 Sanas와 같은 다른 스타트업은 이미 콜센터에서 유사한 기술을 대규모로 구현했습니다.
회사는 사용자 동의를 받아 회의 어시스턴트에서 얻은 데이터를 사용해 다양한 억양과 방언을 나타내는 수천 개의 음성 샘플로 모델을 훈련시켰습니다.
Minasyan은 이 기능의 또 다른 이점을 강조했습니다. 사용자의 음성에 대한 사전 훈련이 필요 없으며, 실시간으로 화자 프로필을 동적으로 생성합니다.
2021년에 마지막으로 자금을 조달한 Krisp는 올해 말 iOS 및 Android 앱을 출시하여 대면 회의를 강화할 예정입니다. 또한 Google Meet과의 통합을 개선하기 위해 새로운 Chrome 확장 프로그램을 개발 중입니다.
ElevenLabs, 블랙록·제이미 폭스·에바 롱고리아를 신규 투자자로 선정
음성 AI 기업 일레븐랩스(ElevenLabs)는 지난 2월에 처음 발표했던 5억 달러 규모의 시리즈 D 투자 라운드에 참여한 추가 투자자들을 공개했다. 이번 투자자 명단에는 블랙록(BlackRock), 웰링턴(Wellington), D.E. 쇼(D.E. Shaw), 슈로더(Schroders)와 같은 기관 투자자들과 엔비디아(NVIDIA), 세일즈포스(Sa
텍스트 번역으로 유명한 DeepL이 이제 음성 번역 시장에 진출한다
텍스트 기반 도구로 잘 알려진 번역 기업 DeepL이 오늘, 맞춤형 애플리케이션을 통해 현장 근무자들을 위한 회의, 모바일 및 웹 대화, 그룹 토론 등의 상황을 지원하는 음성-음성 번역 제품군을 출시했습니다. 또한 이 회사는 외부 개발자와 기업들이 콜센터와 같은 맞춤형 사용 사례를 위해 DeepL의 기술을 기반으로 서비스를 구축할 수 있도록 지원하는 API
미스트랄, 오픈소스 음성 생성 모델 공개
프랑스의 AI 기업 미스트랄(Mistral)은 목요일, 음성 AI 비서 및 고객 지원과 같은 기업용 애플리케이션을 위해 설계된 새로운 오픈소스 텍스트-투-스피치(TTS) 모델을 공개했다. 이 모델을 통해 기업들은 영업 및 고객 소통을 위한 음성 에이전트를 구축할 수 있게 되었으며, 미스트랄은 이를 통해 일레븐랩스(ElevenLabs), 딥그램(Deepgra
오늘 AI로 억양 변환하는 기술 기사 읽었는데요. 우리나라에서도 한참 영어 발음 걱정하는 사람들 많은데, 이 기술이 한국인 억양도 분석해줄 수 있을까요? 한국 영어교육 시장에 적용되면 진짜 대박 날 거 같은데... 🤔 그런데 미국식 억양이 ‘표준’이라는 가정 자체가 좀 불편하네요.
Je trouve ça un peu inquiétant ce besoin de gommer les accents régionaux pour correspondre à une norme... L'intelligence artificielle devrait-elle vraiment servir à uniformiser nos identités culturelles au lieu de nous aider à mieux nous comprendre mutuellement ? 😕
This AI accent switch is wild! It’s like giving your voice a Hollywood makeover in real-time. I wonder how it handles regional Indian accents—pretty cool for call centers, but does it make everyone sound like a generic American newscaster? 😄
La nueva función de IA de Krisp para sonar americano es alucinante. Es genial cambiar de acento en las llamadas, pero es raro perder mi acento indio. Es útil para el trabajo, pero espero que no nos haga sonar todos iguales. 🤔





집






