O Google integra o modelo de voz Chirp 3 ao vértice ai

A IA generativa tem sido amplamente sobre interfaces baseadas em texto para criar textos, imagens e mais. Mas agora, a voz está entrando em destaque, e está chegando com força. A Google acabou de anunciar uma grande novidade: a partir da próxima semana, eles estão lançando o Chirp 3 — seus mais recentes modelos de fala para texto e texto para fala em HD — na plataforma Vertex AI.
Na última semana, a Google meio que anunciou discretamente que o Chirp 3 apresentaria oito novas vozes em 31 idiomas. Essa tecnologia é perfeita para construir assistentes de voz, criar audiolivros e até desenvolver agentes de suporte e narrações para vídeos. Eles compartilharam isso em um evento nos escritórios da DeepMind da Google em Londres.
A Google não é a única a embarcar na onda da IA de voz. Na última semana, a Sesame, responsável pelas vozes de IA super-realistas "Maya" e "Miles," anunciou que está permitindo que desenvolvedores construam seus próprios aplicativos e serviços personalizados usando sua tecnologia.
A Google está tentando manter as coisas sob controle com o Chirp 3, implementando algumas restrições de uso para evitar mau uso. "Estamos apenas trabalhando em algumas dessas questões com nossa equipe de segurança," disse Thomas Kurian, o CEO da Google Cloud, em um evento de notícias hoje.
A ElevenLabs é outro grande player no jogo da voz de IA, tendo arrecadado milhões para expandir seus serviços de voz.
Com o Chirp 3, a Google está trazendo-o para a mesma família das versões mais recentes do LLM Gemini, que ainda estão em teste, junto com seu modelo de geração de imagens Imagen e a ferramenta de geração de vídeos Veo 2, que é cara.
Ainda está no ar se o Chirp 3 soará tão "real" quanto algumas outras vozes de IA por aí (o trabalho da Sesame é bastante impressionante). Mas, como Demis Hassabis, o CEO da DeepMind, destacou, isso é uma maratona, não um sprint.
"No curto prazo ... essa ideia de que [a IA é] uma bala de prata para tudo nos próximos dois anos, eu não vejo isso acontecendo ainda. Acho que ainda estamos a alguns anos de algo como AGI acontecer," ele disse. "Vai mudar as coisas ... ao longo da próxima década, então no médio a longo prazo. É um daqueles momentos interessantes no tempo."
A Google lançou o Vertex AI em 2021 como um espaço para desenvolvedores construírem serviços de aprendizado de máquina na nuvem. Isso foi muito antes da IA, e especialmente da IA generativa, se tornar o tópico quente que é agora, graças aos serviços GPT da OpenAI.
Desde então, a Google tem investido pesado no Vertex AI, tentando acompanhar empresas como Microsoft e Amazon, que também estão desenvolvendo ferramentas de IA generativa para desenvolvedores. Com o Vertex AI, os desenvolvedores podem não apenas construir sobre o Gemini, mas também classificar dados, treinar modelos e prepará-los para produção. Será interessante ver se a Google decidirá abrir seu jardim para modelos de outros criadores.
A Google está nessa coisa de voz "Chirp" há anos, começando lá atrás quando usaram isso como um codinome para competir com a Alexa da Amazon.
Artigo relacionado
O Google lança o Gemini no Chrome na Índia
Na quarta-feira, o Google anunciou que está expandindo a integração do Gemini com o Chrome para novas regiões, incluindo Índia, Canadá e Nova Zelândia. Essa implementação permite que os usuários de co
A Mistral lança um modelo de geração de fala de código aberto
A empresa francesa de IA Mistral revelou na quinta-feira um novo modelo de conversão de texto em fala de código aberto, projetado para assistentes de voz com IA e aplicações empresariais, como atendim
O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas
Na terça-feira, o YouTube anunciou que está expandindo sua tecnologia de detecção de deepfakes para um grupo seleto de autoridades governamentais, candidatos políticos e jornalistas. A ferramenta iden
Recomendações de tópicos especiais relacionados
Comentários (65)
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎

A IA generativa tem sido amplamente sobre interfaces baseadas em texto para criar textos, imagens e mais. Mas agora, a voz está entrando em destaque, e está chegando com força. A Google acabou de anunciar uma grande novidade: a partir da próxima semana, eles estão lançando o Chirp 3 — seus mais recentes modelos de fala para texto e texto para fala em HD — na plataforma Vertex AI.
Na última semana, a Google meio que anunciou discretamente que o Chirp 3 apresentaria oito novas vozes em 31 idiomas. Essa tecnologia é perfeita para construir assistentes de voz, criar audiolivros e até desenvolver agentes de suporte e narrações para vídeos. Eles compartilharam isso em um evento nos escritórios da DeepMind da Google em Londres.
A Google não é a única a embarcar na onda da IA de voz. Na última semana, a Sesame, responsável pelas vozes de IA super-realistas "Maya" e "Miles," anunciou que está permitindo que desenvolvedores construam seus próprios aplicativos e serviços personalizados usando sua tecnologia.
A Google está tentando manter as coisas sob controle com o Chirp 3, implementando algumas restrições de uso para evitar mau uso. "Estamos apenas trabalhando em algumas dessas questões com nossa equipe de segurança," disse Thomas Kurian, o CEO da Google Cloud, em um evento de notícias hoje.
A ElevenLabs é outro grande player no jogo da voz de IA, tendo arrecadado milhões para expandir seus serviços de voz.
Com o Chirp 3, a Google está trazendo-o para a mesma família das versões mais recentes do LLM Gemini, que ainda estão em teste, junto com seu modelo de geração de imagens Imagen e a ferramenta de geração de vídeos Veo 2, que é cara.
Ainda está no ar se o Chirp 3 soará tão "real" quanto algumas outras vozes de IA por aí (o trabalho da Sesame é bastante impressionante). Mas, como Demis Hassabis, o CEO da DeepMind, destacou, isso é uma maratona, não um sprint.
"No curto prazo ... essa ideia de que [a IA é] uma bala de prata para tudo nos próximos dois anos, eu não vejo isso acontecendo ainda. Acho que ainda estamos a alguns anos de algo como AGI acontecer," ele disse. "Vai mudar as coisas ... ao longo da próxima década, então no médio a longo prazo. É um daqueles momentos interessantes no tempo."
A Google lançou o Vertex AI em 2021 como um espaço para desenvolvedores construírem serviços de aprendizado de máquina na nuvem. Isso foi muito antes da IA, e especialmente da IA generativa, se tornar o tópico quente que é agora, graças aos serviços GPT da OpenAI.
Desde então, a Google tem investido pesado no Vertex AI, tentando acompanhar empresas como Microsoft e Amazon, que também estão desenvolvendo ferramentas de IA generativa para desenvolvedores. Com o Vertex AI, os desenvolvedores podem não apenas construir sobre o Gemini, mas também classificar dados, treinar modelos e prepará-los para produção. Será interessante ver se a Google decidirá abrir seu jardim para modelos de outros criadores.
A Google está nessa coisa de voz "Chirp" há anos, começando lá atrás quando usaram isso como um codinome para competir com a Alexa da Amazon.
O Google lança o Gemini no Chrome na Índia
Na quarta-feira, o Google anunciou que está expandindo a integração do Gemini com o Chrome para novas regiões, incluindo Índia, Canadá e Nova Zelândia. Essa implementação permite que os usuários de co
A Mistral lança um modelo de geração de fala de código aberto
A empresa francesa de IA Mistral revelou na quinta-feira um novo modelo de conversão de texto em fala de código aberto, projetado para assistentes de voz com IA e aplicações empresariais, como atendim
O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas
Na terça-feira, o YouTube anunciou que está expandindo sua tecnologia de detecção de deepfakes para um grupo seleto de autoridades governamentais, candidatos políticos e jornalistas. A ferramenta iden
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎





Lar






