음성 입력 및 가상 어시스턴트로 Chrome 확장 기능을 강화한 Speechify
Speechify는 주로 기사, PDF, 문서를 듣기 위한 도구로 알려져 있습니다. 이 회사는 이제 음성 인식 기능으로 Chrome 확장 프로그램을 강화하여 음성 입력 기능과 질문에 답하는 대화형 음성 어시스턴트 기능을 도입했습니다.
지난 한 해 동안 음성 인식 모델의 품질이 크게 개선되면서 음성 인식 도구가 급증했습니다. Speechify는 처음에는 영어를 지원하는 자체 받아쓰기 도구를 출시하여 이러한 트렌드를 활용하고 있습니다. 다른 솔루션과 마찬가지로 Speechify의 음성 입력은 자동으로 오류를 수정하고 필러 단어를 제거합니다.
하루 남짓한 짧은 테스트 기간 동안 저는 Speechify의 도구가 개선의 여지가 상당히 많다는 것을 발견했습니다. 예를 들어, Gmail과 Google 문서에서는 잘 작동했지만 WordPress와 같은 웹사이트에서는 음성 받아쓰기 기능을 활성화하고 안정적인 성능을 달성하는 데 문제가 발생했습니다. 이 회사는 인기 있는 사이트를 위해 점진적으로 도구를 최적화하고 있다고 밝혔습니다.

이미지 크레딧: Speechify 정확도와 관련하여 이 도구의 단어 오류율은 Wispr Flow, Willow, Monologue와 같은 경쟁 제품보다 높았습니다. Speechify는 자사의 모델이 자주 사용할수록 개선되어 오류율이 점진적으로 감소한다고 언급했습니다.
이 스타트업은 브라우저 내 사이드바에서 액세스할 수 있는 대화형 음성 어시스턴트도 선보이고 있습니다. "세 가지 요점이 뭐야?" 또는 "더 간단한 용어로 설명해줘"와 같이 보고 있는 웹페이지에 대해 질문할 수 있습니다.
ChatGPT와 Gemini는 대화형 음성 모드를 제공하지만, Speechify는 이러한 기능이 해당 플랫폼에서 부차적인 기능이라고 주장합니다. 이와는 대조적으로 이 스타트업은 음성 상호작용을 자체 도구의 핵심적이고 중심적인 경험으로 삼고 있습니다.
"저희는 사용자가 ChatGPT 또는 Gemini 앱을 열 때 항상 텍스트 기반 채팅이 기본 경험이 될 것이라고 믿습니다. 이것이 바로 고객들이 기대하는 것이니까요. 음성 상호작용은 보조 기능으로 남을 가능성이 높으며, 이러한 제공업체는 종종 나중에 고려하게 될 것입니다. 스피치파이의 최고 비즈니스 책임자인 로한 파불루리는 테크크런치에 보낸 이메일에서 "스피치파이의 수년간의 경험을 통해 우리 사용자를 포함한 시장의 상당 부분이 AI와 상호작용할 때 음성을 기본 모드로 선호한다는 것을 알게 되었습니다."라고 설명했습니다.
테크크런치 이벤트Disrupt 2026 대기자 명단에 참여하기
Disrupt 2026 대기자 명단에 이름을 올려 얼리버드 티켓을 우선적으로 이용할 수 있는 기회를 확보하세요. 지난 Disrupt 무대에는 Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, 허깅 페이스, 엘라드 길, 비노드 코슬라 등 250명이 넘는 업계 전문가가 참여해 성장을 가속화하고 경쟁력을 강화할 수 있는 200개 이상의 세션을 이끌었습니다. 또한 모든 분야에서 혁신을 주도하는 수백 개의 스타트업과 교류할 수 있는 기회도 주어집니다.
Disrupt 2026 대기자 명단에 참여하기
디스럽트 2026 대기자 명단에 이름을 올려 얼리버드 티켓을 우선적으로 이용할 수 있는 기회를 확보하세요. 지난 Disrupt 무대에는 Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil, Vinod Khosla 등 250명이 넘는 업계 전문가가 참여해 성장을 가속화하고 경쟁력을 강화할 수 있도록 설계된 200개 이상의 세션을 이끌었습니다. 또한 모든 분야에서 혁신을 주도하는 수백 개의 스타트업과 교류할 수 있는 기회도 주어집니다.
샌프란시스코 | 2026년 10월 13~15일 지금 대기자 명단에 등록하기현재 한 가지 한계는 Speechify의 어시스턴트가 OpenAI의 Atlas, Perplexity의 Comet, Dia와 같이 사이드바 어시스턴트가 내장된 브라우저와 호환되지 않는다는 것입니다. 이 스타트업은 이 확장 프로그램이 주로 Chrome과 그 방대한 사용자 기반을 위해 설계되었기 때문에 크게 걱정하지 않습니다.
Speechify는 단계적으로 모든 데스크톱 및 모바일 애플리케이션에 음성 입력과 음성 비서 기능을 통합할 계획입니다.
또한 자율적으로 작업을 수행할 수 있는 AI 에이전트를 개발하는 것을 목표로 하고 있습니다. 전체 로드맵은 공개되지 않았지만 한 가지 예로 상담원이 전화를 걸어 약속을 잡거나 고객 서비스를 대기하도록 하는 것이 제시되었습니다. 트루콜러와 클로크드 같은 다른 회사들도 비슷한 목표를 추구하고 있습니다.
관련 기사
미스트랄, 오픈소스 음성 생성 모델 공개
프랑스의 AI 기업 미스트랄(Mistral)은 목요일, 음성 AI 비서 및 고객 지원과 같은 기업용 애플리케이션을 위해 설계된 새로운 오픈소스 텍스트-투-스피치(TTS) 모델을 공개했다. 이 모델을 통해 기업들은 영업 및 고객 소통을 위한 음성 에이전트를 구축할 수 있게 되었으며, 미스트랄은 이를 통해 일레븐랩스(ElevenLabs), 딥그램(Deepgra
최고의 AI 음성 입력 앱: 전문가 리뷰 및 순위
AI 음성 인식 앱은 비교적 짧은 기간 동안 놀라운 발전을 이루었습니다. 오랫동안 이 앱들은 반응이 느리고 오류가 잦아, 사용자가 특정한 억양으로 매우 명확하게 말해야만 했습니다.하지만 대규모 언어 모델(LLM)과 음성 인식 기술의 발전으로 상황이 바뀌었으며, 이제는 음성을 더 정확하게 이해할 뿐만 아니라 문맥을 활용해 텍스트를 적절하게 서식화할 수 있는
Wispr Flow, 어려움에도 불구하고 인도 음성 AI 시장의 미래에 주목하다
인도의 디지털 환경은 음성 메모부터 다국어 메시징에 이르기까지 음성 기술과 깊이 밀접하게 연결되어 있습니다. 그러나 인도의 언어적 다양성, 코드 스위칭 관행, 그리고 제각각인 수익화 잠재력을 고려할 때, 이러한 보편적인 사용 습관을 확장 가능한 AI 사업으로 전환하는 데는 상당한 어려움이 따릅니다. Wispr Flow는 이 복잡하지만 유망한 기회를 공략하기
관련 특별 주제 추천
의견 (1)
0/500
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅
Speechify는 주로 기사, PDF, 문서를 듣기 위한 도구로 알려져 있습니다. 이 회사는 이제 음성 인식 기능으로 Chrome 확장 프로그램을 강화하여 음성 입력 기능과 질문에 답하는 대화형 음성 어시스턴트 기능을 도입했습니다.
지난 한 해 동안 음성 인식 모델의 품질이 크게 개선되면서 음성 인식 도구가 급증했습니다. Speechify는 처음에는 영어를 지원하는 자체 받아쓰기 도구를 출시하여 이러한 트렌드를 활용하고 있습니다. 다른 솔루션과 마찬가지로 Speechify의 음성 입력은 자동으로 오류를 수정하고 필러 단어를 제거합니다.
하루 남짓한 짧은 테스트 기간 동안 저는 Speechify의 도구가 개선의 여지가 상당히 많다는 것을 발견했습니다. 예를 들어, Gmail과 Google 문서에서는 잘 작동했지만 WordPress와 같은 웹사이트에서는 음성 받아쓰기 기능을 활성화하고 안정적인 성능을 달성하는 데 문제가 발생했습니다. 이 회사는 인기 있는 사이트를 위해 점진적으로 도구를 최적화하고 있다고 밝혔습니다.

정확도와 관련하여 이 도구의 단어 오류율은 Wispr Flow, Willow, Monologue와 같은 경쟁 제품보다 높았습니다. Speechify는 자사의 모델이 자주 사용할수록 개선되어 오류율이 점진적으로 감소한다고 언급했습니다.
이 스타트업은 브라우저 내 사이드바에서 액세스할 수 있는 대화형 음성 어시스턴트도 선보이고 있습니다. "세 가지 요점이 뭐야?" 또는 "더 간단한 용어로 설명해줘"와 같이 보고 있는 웹페이지에 대해 질문할 수 있습니다.
ChatGPT와 Gemini는 대화형 음성 모드를 제공하지만, Speechify는 이러한 기능이 해당 플랫폼에서 부차적인 기능이라고 주장합니다. 이와는 대조적으로 이 스타트업은 음성 상호작용을 자체 도구의 핵심적이고 중심적인 경험으로 삼고 있습니다.
"저희는 사용자가 ChatGPT 또는 Gemini 앱을 열 때 항상 텍스트 기반 채팅이 기본 경험이 될 것이라고 믿습니다. 이것이 바로 고객들이 기대하는 것이니까요. 음성 상호작용은 보조 기능으로 남을 가능성이 높으며, 이러한 제공업체는 종종 나중에 고려하게 될 것입니다. 스피치파이의 최고 비즈니스 책임자인 로한 파불루리는 테크크런치에 보낸 이메일에서 "스피치파이의 수년간의 경험을 통해 우리 사용자를 포함한 시장의 상당 부분이 AI와 상호작용할 때 음성을 기본 모드로 선호한다는 것을 알게 되었습니다."라고 설명했습니다.
테크크런치 이벤트Disrupt 2026 대기자 명단에 참여하기
Disrupt 2026 대기자 명단에 이름을 올려 얼리버드 티켓을 우선적으로 이용할 수 있는 기회를 확보하세요. 지난 Disrupt 무대에는 Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, 허깅 페이스, 엘라드 길, 비노드 코슬라 등 250명이 넘는 업계 전문가가 참여해 성장을 가속화하고 경쟁력을 강화할 수 있는 200개 이상의 세션을 이끌었습니다. 또한 모든 분야에서 혁신을 주도하는 수백 개의 스타트업과 교류할 수 있는 기회도 주어집니다.
Disrupt 2026 대기자 명단에 참여하기
디스럽트 2026 대기자 명단에 이름을 올려 얼리버드 티켓을 우선적으로 이용할 수 있는 기회를 확보하세요. 지난 Disrupt 무대에는 Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil, Vinod Khosla 등 250명이 넘는 업계 전문가가 참여해 성장을 가속화하고 경쟁력을 강화할 수 있도록 설계된 200개 이상의 세션을 이끌었습니다. 또한 모든 분야에서 혁신을 주도하는 수백 개의 스타트업과 교류할 수 있는 기회도 주어집니다.
샌프란시스코 | 2026년 10월 13~15일 지금 대기자 명단에 등록하기현재 한 가지 한계는 Speechify의 어시스턴트가 OpenAI의 Atlas, Perplexity의 Comet, Dia와 같이 사이드바 어시스턴트가 내장된 브라우저와 호환되지 않는다는 것입니다. 이 스타트업은 이 확장 프로그램이 주로 Chrome과 그 방대한 사용자 기반을 위해 설계되었기 때문에 크게 걱정하지 않습니다.
Speechify는 단계적으로 모든 데스크톱 및 모바일 애플리케이션에 음성 입력과 음성 비서 기능을 통합할 계획입니다.
또한 자율적으로 작업을 수행할 수 있는 AI 에이전트를 개발하는 것을 목표로 하고 있습니다. 전체 로드맵은 공개되지 않았지만 한 가지 예로 상담원이 전화를 걸어 약속을 잡거나 고객 서비스를 대기하도록 하는 것이 제시되었습니다. 트루콜러와 클로크드 같은 다른 회사들도 비슷한 목표를 추구하고 있습니다.
미스트랄, 오픈소스 음성 생성 모델 공개
프랑스의 AI 기업 미스트랄(Mistral)은 목요일, 음성 AI 비서 및 고객 지원과 같은 기업용 애플리케이션을 위해 설계된 새로운 오픈소스 텍스트-투-스피치(TTS) 모델을 공개했다. 이 모델을 통해 기업들은 영업 및 고객 소통을 위한 음성 에이전트를 구축할 수 있게 되었으며, 미스트랄은 이를 통해 일레븐랩스(ElevenLabs), 딥그램(Deepgra
최고의 AI 음성 입력 앱: 전문가 리뷰 및 순위
AI 음성 인식 앱은 비교적 짧은 기간 동안 놀라운 발전을 이루었습니다. 오랫동안 이 앱들은 반응이 느리고 오류가 잦아, 사용자가 특정한 억양으로 매우 명확하게 말해야만 했습니다.하지만 대규모 언어 모델(LLM)과 음성 인식 기술의 발전으로 상황이 바뀌었으며, 이제는 음성을 더 정확하게 이해할 뿐만 아니라 문맥을 활용해 텍스트를 적절하게 서식화할 수 있는
Wispr Flow, 어려움에도 불구하고 인도 음성 AI 시장의 미래에 주목하다
인도의 디지털 환경은 음성 메모부터 다국어 메시징에 이르기까지 음성 기술과 깊이 밀접하게 연결되어 있습니다. 그러나 인도의 언어적 다양성, 코드 스위칭 관행, 그리고 제각각인 수익화 잠재력을 고려할 때, 이러한 보편적인 사용 습관을 확장 가능한 AI 사업으로 전환하는 데는 상당한 어려움이 따릅니다. Wispr Flow는 이 복잡하지만 유망한 기회를 공략하기
Endlich mal eine sinnvolle Erweiterung für Chrome! Die Sprachsteuerung ist genau das, was mir im Alltag fehlt, besonders wenn ich müde bin und nicht tippen möchte. Hoffentlich wird die KI-Assistentin nicht zu aufdringlich und sammelt keine sensiblen Daten. Das wäre ein echter Dealbreaker. Mal sehen, wie sich das im Vergleich zu anderen Tools schlägt. 😅





집






