ElevenLabs, 음성-텍스트 변환 분야 새로운 기준을 제시; 구글 제미니, 폭넓은 기능으로 뒤를 잇다
Artificial Analysis가 음성-텍스트 변환 벤치마크의 최신 버전인 AA-WER v2.0을 공개했습니다. 이번 결과에서 ElevenLabs와 Google이 음성 텍스트 변환 성능 면에서 확실한 선두 주자로 부상했습니다.

핵심 지표인 단어 오류율(WER) 기준으로 측정했을 때, 일레븐랩스의 '스크라이브(Scribe) v2'가 2.3%라는 놀라울 정도로 낮은 오류율로 1위를 차지했습니다. 그 뒤를 구글의 '제미니3프로(Gemini3Pro)'가 2.9%로 바짝 뒤쫓았습니다 . 주목할 점은 구글이 제미니를 전사 작업에 특화하여 미세 조정하지 않았다는 사실이며, 이 결과는 순전히 제미니의 견고한 다중 모달 일반 성능에서 비롯된 것입니다.
다른 주요 모델들의 결과는 다음과 같습니다:
Mistral Voxtral Small: 3.0%의 오류율로 3위를 차지했습니다.
Google Gemini3Flash: 3.1%의 오류율로 안정적인 성능을 보여주었습니다.
오픈AI 위스퍼 라지 v3: 가장 널리 사용되는 오픈소스 모델로, 4.2%의 오류율을 기록하며 중간 순위에 위치했다.
성적이 가장 저조한 모델: 알리바바의 Qwen3ASR Flash (5.9%), 아마존의 Nova2Omni (6.0%), Rev AI (6.1%)가 순위표 하단을 차지했습니다.

음성 어시스턴트 명령어 전용 AA-AgentTalk 벤치마크에서도 순위 변동은 없었습니다. ElevenLabs의 Scribe v2와 Google의 Gemini3Pro는 각각 1.6%와 1.7%의 오류율로 선두를 유지하며, 짧고 직접적인 음성 상호작용에서 매우 높은 신뢰성을 입증했습니다.
관련 기사
오픈AI CEO 알트먼, 앤트로픽의 ‘공황에 휩싸인’ 마케팅 전략을 맹비난
AI 업계의 선두주자인 오픈AI(OpenAI)와 앤트로픽(Anthropic) 간의 공개적 공방이 더욱 격화되고 있다. 오픈AI의 CEO인 샘 알트먼은 최근 한 팟캐스트에서 경쟁사의 최신 안전 모델에 의문을 제기했다.알트먼은 앤트로픽이 기술에 대한 대중의 두려움을 이용해 자사 제품의 실제 성능을 과대포장하고 있다고 주장한다. 그는 이러한 접근 방식을 진정한
커서 AI 코딩 스타트업, 스페이스X로부터 대규모 투자 유치 후 아시아태평양 지역에서 200명 채용 예정
AI 코딩 스타트업 커서(Cursor)가 향후 6개월 동안 아시아 태평양 지역 전역에서 200명의 직원을 채용할 계획이라고 밝히며 대규모 글로벌 확장 계획을 발표했다. 주요 채용 직종으로는 마케팅 엔지니어, 현장 엔지니어, AI 배포 엔지니어 등이 포함된다. 이번 조치는 샌프란시스코에 본사를 둔 이 유니콘 기업이 자사의 핵심 기술을 국제 시장에 진출시키려는
클로드(Claude)가 악성 npm 패키지 제작에 악용됨: 670개 이상의 패키지가 해킹당해 오픈소스 생태계에 위협
최근 발생한 사이버 보안 사고를 통해 대규모 언어 모델(LLM)이 악성 소프트웨어 개발에 악용되고 있는 실태가 드러났다. 보안 연구원 시비 무사(Sibi Moosa)는 ‘mousie-5212-super-formatter’라는 가명을 사용하는 공격자가 앤트로픽(Anthropic)의 클로드(Claude) AI를 활용해 유해한 코드를 생성하고 npm 패키지 생태
관련 특별 주제 추천
의견 (1)
0/500
Artificial Analysis가 음성-텍스트 변환 벤치마크의 최신 버전인 AA-WER v2.0을 공개했습니다. 이번 결과에서 ElevenLabs와 Google이 음성 텍스트 변환 성능 면에서 확실한 선두 주자로 부상했습니다.

핵심 지표인 단어 오류율(WER) 기준으로 측정했을 때, 일레븐랩스의 '스크라이브(Scribe) v2'가 2.3%라는 놀라울 정도로 낮은 오류율로 1위를 차지했습니다. 그 뒤를 구글의 '제미니3프로(Gemini3Pro)'가 2.9%로 바짝 뒤쫓았습니다 . 주목할 점은 구글이 제미니를 전사 작업에 특화하여 미세 조정하지 않았다는 사실이며, 이 결과는 순전히 제미니의 견고한 다중 모달 일반 성능에서 비롯된 것입니다.
다른 주요 모델들의 결과는 다음과 같습니다:
Mistral Voxtral Small: 3.0%의 오류율로 3위를 차지했습니다.
Google Gemini3Flash: 3.1%의 오류율로 안정적인 성능을 보여주었습니다.
오픈AI 위스퍼 라지 v3: 가장 널리 사용되는 오픈소스 모델로, 4.2%의 오류율을 기록하며 중간 순위에 위치했다.
성적이 가장 저조한 모델: 알리바바의 Qwen3ASR Flash (5.9%), 아마존의 Nova2Omni (6.0%), Rev AI (6.1%)가 순위표 하단을 차지했습니다.

음성 어시스턴트 명령어 전용 AA-AgentTalk 벤치마크에서도 순위 변동은 없었습니다. ElevenLabs의 Scribe v2와 Google의 Gemini3Pro는 각각 1.6%와 1.7%의 오류율로 선두를 유지하며, 짧고 직접적인 음성 상호작용에서 매우 높은 신뢰성을 입증했습니다.
오픈AI CEO 알트먼, 앤트로픽의 ‘공황에 휩싸인’ 마케팅 전략을 맹비난
AI 업계의 선두주자인 오픈AI(OpenAI)와 앤트로픽(Anthropic) 간의 공개적 공방이 더욱 격화되고 있다. 오픈AI의 CEO인 샘 알트먼은 최근 한 팟캐스트에서 경쟁사의 최신 안전 모델에 의문을 제기했다.알트먼은 앤트로픽이 기술에 대한 대중의 두려움을 이용해 자사 제품의 실제 성능을 과대포장하고 있다고 주장한다. 그는 이러한 접근 방식을 진정한
커서 AI 코딩 스타트업, 스페이스X로부터 대규모 투자 유치 후 아시아태평양 지역에서 200명 채용 예정
AI 코딩 스타트업 커서(Cursor)가 향후 6개월 동안 아시아 태평양 지역 전역에서 200명의 직원을 채용할 계획이라고 밝히며 대규모 글로벌 확장 계획을 발표했다. 주요 채용 직종으로는 마케팅 엔지니어, 현장 엔지니어, AI 배포 엔지니어 등이 포함된다. 이번 조치는 샌프란시스코에 본사를 둔 이 유니콘 기업이 자사의 핵심 기술을 국제 시장에 진출시키려는
클로드(Claude)가 악성 npm 패키지 제작에 악용됨: 670개 이상의 패키지가 해킹당해 오픈소스 생태계에 위협
최근 발생한 사이버 보안 사고를 통해 대규모 언어 모델(LLM)이 악성 소프트웨어 개발에 악용되고 있는 실태가 드러났다. 보안 연구원 시비 무사(Sibi Moosa)는 ‘mousie-5212-super-formatter’라는 가명을 사용하는 공격자가 앤트로픽(Anthropic)의 클로드(Claude) AI를 활용해 유해한 코드를 생성하고 npm 패키지 생태





집






