옵션
뉴스
Google은 Chirp 3 음성 모델을 Vertex AI에 통합합니다

Google은 Chirp 3 음성 모델을 Vertex AI에 통합합니다

2025년 4월 10일
167

Google은 Chirp 3 음성 모델을 Vertex AI에 통합합니다

생성 AI는 주로 텍스트 기반 인터페이스를 통해 텍스트, 이미지 등을 만드는 데 초점이 맞춰져 왔습니다. 하지만 이제 음성이 주목받고 있으며, 그 기세가 강력합니다. Google은 큰 소식을 발표했습니다: 다음 주부터 Vertex AI 플랫폼에서 최신 음성-텍스트 및 HD 텍스트-음성 모델인 Chirp 3를 출시합니다.

지난주 Google은 Chirp 3가 31개 언어에 걸쳐 8개의 새로운 음성을 도입할 것이라고 조용히 발표했습니다. 이 기술은 음성 비서 구축, 오디오북 제작, 지원 에이전트 및 비디오 음성 해설 제작에 완벽합니다. 이 소식은 런던 Google DeepMind 사무실에서 열린 행사에서 공유되었습니다.

Google만 음성 AI 열풍에 뛰어든 것이 아닙니다. 지난주, 초현실적인 AI 음성 "Maya"와 "Miles"를 만든 Sesame은 개발자들이 그들의 기술을 사용해 맞춤 앱과 서비스를 구축할 수 있게 한다고 발표했습니다.

Google은 Chirp 3에 사용 제한을 두어 오용을 방지하려고 합니다. Google Cloud CEO인 Thomas Kurian은 오늘 뉴스 행사에서 "우리는 안전 팀과 함께 이 문제를 해결하고 있다"고 말했습니다.

ElevenLabs는 AI 음성 분야의 또 다른 주요 플레이어로, 음성 서비스 확장을 위해 수백만 달러를 모금했습니다.

Chirp 3를 통해 Google은 아직 테스트 중인 LLM Gemini의 최신 버전, 이미지 생성 모델 Imagen, 고가의 Veo 2 비디오 생성 도구와 같은 패밀리에 통합하고 있습니다.

Chirp 3가 다른 AI 음성(Sesame의 작업은 꽤 인상적임)만큼 "진짜"처럼 들릴지는 아직 미지수입니다. 하지만 DeepMind CEO인 Demis Hassabis가 지적했듯, 이것은 단거리 경주가 아니라 마라톤입니다.

"단기적으로 ... [AI가] 앞으로 몇 년 안에 모든 것에 대한 만능 해결책이 될 것이라는 생각은 아직 일어나지 않을 것 같습니다. AGI 같은 것이 일어나려면 아직 몇 년 더 걸릴 것입니다,"라고 그는 말했습니다. "앞으로 10년 동안 변화를 가져올 것입니다 ... 중장기적으로. 흥미로운 시점 중 하나입니다."

Google은 2021년에 개발자들이 클라우드에서 기계 학습 서비스를 구축할 수 있는 Vertex AI를 시작했습니다. 이는 AI, 특히 생성 AI가 OpenAI의 GPT 서비스 덕분에 지금처럼 뜨거운话题가 되기 훨씬 전이었습니다.

그 이후로 Google은 Microsoft와 Amazon 같은 경쟁자들과 보조를 맞추기 위해 Vertex AI를 강력히 추진해 왔습니다. Vertex AI를 통해 개발자는 Gemini 위에서 구축할 뿐만 아니라 데이터를 분류하고, 모델을 훈련시키며, 생산 준비를 할 수 있습니다. Google이 다른 창작자의 모델에 정원을 개방할지 지켜보는 것이 흥미로울 것입니다.

Google은 Amazon의 Alexa에 맞서기 위해 코드명으로 사용했던 "Chirp" 음성 작업을 수년간 이어오고 있습니다.

관련 기사
Google, 기업 시장에서 OpenAI와 경쟁하기 위해 생산 준비 완료된 Gemini 2.5 AI 모델 공개 Google, 기업 시장에서 OpenAI와 경쟁하기 위해 생산 준비 완료된 Gemini 2.5 AI 모델 공개 Google은 월요일 AI 전략을 강화하며 기업용으로 고급 Gemini 2.5 모델을 출시하고 가격과 성능 면에서 경쟁할 수 있는 비용 효율적인 변형 모델을 소개했습니다.Alphabet 소유의 이 회사는 주력 AI 모델인 Gemini 2.5 Pro와 Gemini 2.5 Flash를 테스트 단계에서 완전 가용성으로 업그레이드하며 중요한 비즈니스 애플리케이션에
Google, AI 기반 단순화 도구로 더 쉬운 웹 읽기 공개 Google, AI 기반 단순화 도구로 더 쉬운 웹 읽기 공개 Google의 iOS 앱은 이제 AI를 활용하여 복잡한 웹 텍스트를 페이지를 떠나지 않고 명확하고 이해하기 쉬운 콘텐츠로 변환하는 “단순화” 기능을 포함합니다.Google Research에서 개발한 단순화 도구는 Gemini를 사용하여 필수 세부 정보를 유지하면서 복잡한 텍스트를 재구성합니다. 테스트 결과, 정보의 이해와 기억이 향상된 것으로 나타났습니다.
Wispr Flow, iOS 앱 출시로 음성 받아쓰기 혁신 Wispr Flow, iOS 앱 출시로 음성 받아쓰기 혁신 AI 기업들은 점점 더 사용자들이 제품과 음성으로 상호작용하도록 장려하고 있습니다. Meta, Google, OpenAI, Anthropic과 같은 거대 기업들은 고급 음성-텍스트 변환 기능을 통해 AI 봇을 강화하여 자연스러운 대화를 가능하게 했습니다.Wispr Flow라는 스타트업은 100개 이상의 언어를 지원하는 받아쓰기 기술에서 우수성을 주장합니다.
의견 (64)
0/200
JackHernández
JackHernández 2025년 8월 9일 오후 4시 0분 59초 GMT+09:00

Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎

CharlesWhite
CharlesWhite 2025년 8월 4일 오후 3시 48분 52초 GMT+09:00

Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️

RogerMartinez
RogerMartinez 2025년 8월 1일 오후 10시 47분 34초 GMT+09:00

Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?

DennisMitchell
DennisMitchell 2025년 7월 28일 오전 10시 20분 2초 GMT+09:00

Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎

JoeGarcía
JoeGarcía 2025년 4월 21일 오전 11시 59분 24초 GMT+09:00

谷歌在Vertex AI中整合Chirp 3真是太酷了!语音技术终于得到了应有的关注。迫不及待想下周试试看。但希望他们能更多地专注于提高准确性。现在还不是完美的!🤫

HarryLewis
HarryLewis 2025년 4월 15일 오후 12시 15분 2초 GMT+09:00

Vertex AIにChirp 3が導入されて、音声認識がかなり正確になりました。ただ、アクセントが強いと少し苦戦するみたいです。音声アプリの未来が楽しみですね!🚀

위로 돌아갑니다
OR