Google Cloud Melhora Ferramentas de Mídia de IA com Novos Recursos de Música e Vídeo

Na quarta-feira, o Google anunciou melhorias em sua plataforma de nuvem Vertex AI, aprimorando vários modelos de IA geradores de mídia proprietários.
Lyria, a IA de texto para música do Google, está agora em pré-visualização para usuários selecionados, enquanto o modelo de vídeo Veo 2 ganha opções avançadas de edição e efeitos visuais. Além disso, o Google introduziu um recurso de clonagem de voz alimentado pelo Chirp 3, seu modelo de processamento de áudio, para usuários aprovados. O gerador de imagens Imagen 3 agora oferece desempenho significativamente melhorado, segundo o Google.
Anunciadas no Cloud Next, essas atualizações fortalecem a aposta do Google em liderar o mercado de IA generativa empresarial, competindo diretamente com a plataforma Bedrock da Amazon, que oferece ferramentas de IA semelhantes.
O Google promove o Lyria como um substituto para bibliotecas de música livres de royalties, permitindo que os usuários produzam músicas em diversos estilos, desde solos de piano jazz até batidas lo-fi.
O Chirp 3 suporta síntese de fala em aproximadamente 35 idiomas. Inicialmente apresentado no início deste ano, ele alimenta o Instant Custom Voice, que pode replicar uma voz usando apenas 10 segundos de áudio e agora está amplamente disponível. O Chirp 3 também possibilita uma nova ferramenta de pré-visualização, Transcrição com Diarização, que distingue e rotula falantes em gravações com várias pessoas.
Para evitar mau uso, o Instant Custom Voice passa por um processo de verificação para garantir permissões adequadas de uso de voz, diz o Google.
O Veo 2 agora permite que os usuários removam fundos, logotipos ou objetos de vídeos e estendam quadros de vídeo, como converter filmagens de paisagem para retrato. Ele também suporta ajustes de ângulos de câmera e ritmo para cenas geradas por IA, criando efeitos como lapso de tempo ou tomadas estilo drone, e pode interpolar entre quadros inicial e final especificados.
Esses recursos do Veo 2 estão atualmente em pré-visualização.
O Google destacou que as melhorias do Imagen 3 aprimoram sua capacidade de remover objetos e restaurar áreas de imagem ausentes ou danificadas.
Todas as mídias criadas por Imagen, Veo e Lyria (mas não pelo Chirp) carregam a marca d'água SynthID do Google. O Google enfatizou que seus modelos de IA generativa incluem salvaguardas para prevenir a criação de conteúdo prejudicial.
O Google não divulgou os dados de treinamento de seus modelos, um tópico frequentemente debatido devido a preocupações com propriedade intelectual. Algumas empresas treinam IA com material protegido por direitos autorais sem permissão, alegando proteções de uso justo nos EUA, embora criadores frequentemente contestem isso em tribunais.
O Google informou anteriormente ao TechCrunch que oferece opções de exclusão para treinamento de modelos e uma política de indenização para proteger os usuários do Google Cloud e Vertex AI contra reivindicações de direitos autorais relacionadas à IA.
Artigo relacionado
Assistente de IA para Deslumbrar na Tela Gigante da Esfera de Las Vegas
A Sphere Entertainment revelou recentemente planos para uma versão imersiva de O Mágico de Oz adaptada para seu local distinto em Las Vegas, com novas informações revelando como Google e Magnopus estã
Google Revela Óculos Inteligentes Android XR, Faz Parceria com Warby Parker
Google desafia os óculos Ray-Ban Meta da Meta com novas colaborações anunciadas no Google I/O 2025, unindo-se à Gentle Monster e à Warby Parker para desenvolver óculos inteligentes alimentados pelo An
Apple Explora Integração de Pesquisa por IA no Safari
A Apple está explorando ativamente a integração de capacidades de pesquisa orientadas por IA no Safari. Durante o julgamento antitruste do Google na quarta-feira, Eddy Cue, vice-presidente sênior de s
Comentários (0)
0/200
Na quarta-feira, o Google anunciou melhorias em sua plataforma de nuvem Vertex AI, aprimorando vários modelos de IA geradores de mídia proprietários.
Lyria, a IA de texto para música do Google, está agora em pré-visualização para usuários selecionados, enquanto o modelo de vídeo Veo 2 ganha opções avançadas de edição e efeitos visuais. Além disso, o Google introduziu um recurso de clonagem de voz alimentado pelo Chirp 3, seu modelo de processamento de áudio, para usuários aprovados. O gerador de imagens Imagen 3 agora oferece desempenho significativamente melhorado, segundo o Google.
Anunciadas no Cloud Next, essas atualizações fortalecem a aposta do Google em liderar o mercado de IA generativa empresarial, competindo diretamente com a plataforma Bedrock da Amazon, que oferece ferramentas de IA semelhantes.
O Google promove o Lyria como um substituto para bibliotecas de música livres de royalties, permitindo que os usuários produzam músicas em diversos estilos, desde solos de piano jazz até batidas lo-fi.
O Chirp 3 suporta síntese de fala em aproximadamente 35 idiomas. Inicialmente apresentado no início deste ano, ele alimenta o Instant Custom Voice, que pode replicar uma voz usando apenas 10 segundos de áudio e agora está amplamente disponível. O Chirp 3 também possibilita uma nova ferramenta de pré-visualização, Transcrição com Diarização, que distingue e rotula falantes em gravações com várias pessoas.
Para evitar mau uso, o Instant Custom Voice passa por um processo de verificação para garantir permissões adequadas de uso de voz, diz o Google.
O Veo 2 agora permite que os usuários removam fundos, logotipos ou objetos de vídeos e estendam quadros de vídeo, como converter filmagens de paisagem para retrato. Ele também suporta ajustes de ângulos de câmera e ritmo para cenas geradas por IA, criando efeitos como lapso de tempo ou tomadas estilo drone, e pode interpolar entre quadros inicial e final especificados.
Esses recursos do Veo 2 estão atualmente em pré-visualização.
O Google destacou que as melhorias do Imagen 3 aprimoram sua capacidade de remover objetos e restaurar áreas de imagem ausentes ou danificadas.
Todas as mídias criadas por Imagen, Veo e Lyria (mas não pelo Chirp) carregam a marca d'água SynthID do Google. O Google enfatizou que seus modelos de IA generativa incluem salvaguardas para prevenir a criação de conteúdo prejudicial.
O Google não divulgou os dados de treinamento de seus modelos, um tópico frequentemente debatido devido a preocupações com propriedade intelectual. Algumas empresas treinam IA com material protegido por direitos autorais sem permissão, alegando proteções de uso justo nos EUA, embora criadores frequentemente contestem isso em tribunais.
O Google informou anteriormente ao TechCrunch que oferece opções de exclusão para treinamento de modelos e uma política de indenização para proteger os usuários do Google Cloud e Vertex AI contra reivindicações de direitos autorais relacionadas à IA.











