Google은 Chirp 3 음성 모델을 Vertex AI에 통합합니다

생성 AI는 주로 텍스트 기반 인터페이스를 통해 텍스트, 이미지 등을 만드는 데 초점이 맞춰져 왔습니다. 하지만 이제 음성이 주목받고 있으며, 그 기세가 강력합니다. Google은 큰 소식을 발표했습니다: 다음 주부터 Vertex AI 플랫폼에서 최신 음성-텍스트 및 HD 텍스트-음성 모델인 Chirp 3를 출시합니다.
지난주 Google은 Chirp 3가 31개 언어에 걸쳐 8개의 새로운 음성을 도입할 것이라고 조용히 발표했습니다. 이 기술은 음성 비서 구축, 오디오북 제작, 지원 에이전트 및 비디오 음성 해설 제작에 완벽합니다. 이 소식은 런던 Google DeepMind 사무실에서 열린 행사에서 공유되었습니다.
Google만 음성 AI 열풍에 뛰어든 것이 아닙니다. 지난주, 초현실적인 AI 음성 "Maya"와 "Miles"를 만든 Sesame은 개발자들이 그들의 기술을 사용해 맞춤 앱과 서비스를 구축할 수 있게 한다고 발표했습니다.
Google은 Chirp 3에 사용 제한을 두어 오용을 방지하려고 합니다. Google Cloud CEO인 Thomas Kurian은 오늘 뉴스 행사에서 "우리는 안전 팀과 함께 이 문제를 해결하고 있다"고 말했습니다.
ElevenLabs는 AI 음성 분야의 또 다른 주요 플레이어로, 음성 서비스 확장을 위해 수백만 달러를 모금했습니다.
Chirp 3를 통해 Google은 아직 테스트 중인 LLM Gemini의 최신 버전, 이미지 생성 모델 Imagen, 고가의 Veo 2 비디오 생성 도구와 같은 패밀리에 통합하고 있습니다.
Chirp 3가 다른 AI 음성(Sesame의 작업은 꽤 인상적임)만큼 "진짜"처럼 들릴지는 아직 미지수입니다. 하지만 DeepMind CEO인 Demis Hassabis가 지적했듯, 이것은 단거리 경주가 아니라 마라톤입니다.
"단기적으로 ... [AI가] 앞으로 몇 년 안에 모든 것에 대한 만능 해결책이 될 것이라는 생각은 아직 일어나지 않을 것 같습니다. AGI 같은 것이 일어나려면 아직 몇 년 더 걸릴 것입니다,"라고 그는 말했습니다. "앞으로 10년 동안 변화를 가져올 것입니다 ... 중장기적으로. 흥미로운 시점 중 하나입니다."
Google은 2021년에 개발자들이 클라우드에서 기계 학습 서비스를 구축할 수 있는 Vertex AI를 시작했습니다. 이는 AI, 특히 생성 AI가 OpenAI의 GPT 서비스 덕분에 지금처럼 뜨거운话题가 되기 훨씬 전이었습니다.
그 이후로 Google은 Microsoft와 Amazon 같은 경쟁자들과 보조를 맞추기 위해 Vertex AI를 강력히 추진해 왔습니다. Vertex AI를 통해 개발자는 Gemini 위에서 구축할 뿐만 아니라 데이터를 분류하고, 모델을 훈련시키며, 생산 준비를 할 수 있습니다. Google이 다른 창작자의 모델에 정원을 개방할지 지켜보는 것이 흥미로울 것입니다.
Google은 Amazon의 Alexa에 맞서기 위해 코드명으로 사용했던 "Chirp" 음성 작업을 수년간 이어오고 있습니다.
관련 기사
실시간 AI 동영상, 딥 리서치 및 새로운 기능(120자)을 추가한 Google의 Gemini 앱
Google은 I/O 2025 개발자 컨퍼런스에서 멀티모달 기능을 확장하고 차세대 AI 모델을 도입하며 제품 포트폴리오 전반에 걸쳐 에코시스템 통합을 강화하는 등 Gemini AI의 중요한 개선 사항을 공개했습니다.주요 Gemini 라이브 출시Google은 모든 iOS 및 Android 사용자에게 제미니 라이브의 시각 인식 기능을 공식 출시했습니다. 최첨단
어소트 헬스, 환자 커뮤니케이션 자동화를 위한 5,000만 달러 투자 유치
이 거래에 정통한 소식통에 따르면, 전문 진료를 위한 자동화된 환자 커뮤니케이션을 전문으로 하는 신생 AI 의료 스타트업인 Assort Health가 7억 5천만 달러의 가치로 약 5,000만 달러의 시리즈 B 투자를 유치했다고 합니다. 라이트스피드 벤처 파트너스가 주도한 이번 투자는 불과 4개월 전 2,200만 달러 규모의 시리즈 A 라운드에 이은 후속
구글의 최신 제미니 AI 모델은 테스트에서 안전 점수가 하락하고 있습니다.
Google의 내부 테스트 결과 최신 AI 모델의 안전 프로토콜이 이전 버전에 비해 성능이 저하된 것으로 나타났습니다. 새로 발표된 벤치마크에 따르면 Gemini 2.5 플래시 모델은 텍스트와 이미지 프롬프트를 모두 처리할 때 주요 안전 지표에서 가이드라인 위반 비율이 4~10% 더 높은 것으로 나타났습니다.이 기술 대기업의 자동화된 평가는 우려스러운 경향
의견 (65)
0/200
RichardThomas
2025년 9월 22일 오전 9시 30분 31초 GMT+09:00
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
0
JackHernández
2025년 8월 9일 오후 4시 0분 59초 GMT+09:00
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
0
CharlesWhite
2025년 8월 4일 오후 3시 48분 52초 GMT+09:00
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
0
RogerMartinez
2025년 8월 1일 오후 10시 47분 34초 GMT+09:00
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
0
DennisMitchell
2025년 7월 28일 오전 10시 20분 2초 GMT+09:00
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎
0
JoeGarcía
2025년 4월 21일 오전 11시 59분 24초 GMT+09:00
谷歌在Vertex AI中整合Chirp 3真是太酷了!语音技术终于得到了应有的关注。迫不及待想下周试试看。但希望他们能更多地专注于提高准确性。现在还不是完美的!🤫
0
생성 AI는 주로 텍스트 기반 인터페이스를 통해 텍스트, 이미지 등을 만드는 데 초점이 맞춰져 왔습니다. 하지만 이제 음성이 주목받고 있으며, 그 기세가 강력합니다. Google은 큰 소식을 발표했습니다: 다음 주부터 Vertex AI 플랫폼에서 최신 음성-텍스트 및 HD 텍스트-음성 모델인 Chirp 3를 출시합니다.
지난주 Google은 Chirp 3가 31개 언어에 걸쳐 8개의 새로운 음성을 도입할 것이라고 조용히 발표했습니다. 이 기술은 음성 비서 구축, 오디오북 제작, 지원 에이전트 및 비디오 음성 해설 제작에 완벽합니다. 이 소식은 런던 Google DeepMind 사무실에서 열린 행사에서 공유되었습니다.
Google만 음성 AI 열풍에 뛰어든 것이 아닙니다. 지난주, 초현실적인 AI 음성 "Maya"와 "Miles"를 만든 Sesame은 개발자들이 그들의 기술을 사용해 맞춤 앱과 서비스를 구축할 수 있게 한다고 발표했습니다.
Google은 Chirp 3에 사용 제한을 두어 오용을 방지하려고 합니다. Google Cloud CEO인 Thomas Kurian은 오늘 뉴스 행사에서 "우리는 안전 팀과 함께 이 문제를 해결하고 있다"고 말했습니다.
ElevenLabs는 AI 음성 분야의 또 다른 주요 플레이어로, 음성 서비스 확장을 위해 수백만 달러를 모금했습니다.
Chirp 3를 통해 Google은 아직 테스트 중인 LLM Gemini의 최신 버전, 이미지 생성 모델 Imagen, 고가의 Veo 2 비디오 생성 도구와 같은 패밀리에 통합하고 있습니다.
Chirp 3가 다른 AI 음성(Sesame의 작업은 꽤 인상적임)만큼 "진짜"처럼 들릴지는 아직 미지수입니다. 하지만 DeepMind CEO인 Demis Hassabis가 지적했듯, 이것은 단거리 경주가 아니라 마라톤입니다.
"단기적으로 ... [AI가] 앞으로 몇 년 안에 모든 것에 대한 만능 해결책이 될 것이라는 생각은 아직 일어나지 않을 것 같습니다. AGI 같은 것이 일어나려면 아직 몇 년 더 걸릴 것입니다,"라고 그는 말했습니다. "앞으로 10년 동안 변화를 가져올 것입니다 ... 중장기적으로. 흥미로운 시점 중 하나입니다."
Google은 2021년에 개발자들이 클라우드에서 기계 학습 서비스를 구축할 수 있는 Vertex AI를 시작했습니다. 이는 AI, 특히 생성 AI가 OpenAI의 GPT 서비스 덕분에 지금처럼 뜨거운话题가 되기 훨씬 전이었습니다.
그 이후로 Google은 Microsoft와 Amazon 같은 경쟁자들과 보조를 맞추기 위해 Vertex AI를 강력히 추진해 왔습니다. Vertex AI를 통해 개발자는 Gemini 위에서 구축할 뿐만 아니라 데이터를 분류하고, 모델을 훈련시키며, 생산 준비를 할 수 있습니다. Google이 다른 창작자의 모델에 정원을 개방할지 지켜보는 것이 흥미로울 것입니다.
Google은 Amazon의 Alexa에 맞서기 위해 코드명으로 사용했던 "Chirp" 음성 작업을 수년간 이어오고 있습니다.


Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!




Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎




Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️




Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?




Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎




谷歌在Vertex AI中整合Chirp 3真是太酷了!语音技术终于得到了应有的关注。迫不及待想下周试试看。但希望他们能更多地专注于提高准确性。现在还不是完美的!🤫












