Google Cloud verbessert KI-Medientools mit neuen Musik- und Videofunktionen

Am Mittwoch stellte Google Upgrades für seine Vertex AI-Cloud-Plattform vor, die mehrere proprietäre, medien-generierende KI-Modelle verbessern.
Lyria, Googles Text-zu-Musik-KI, ist nun für ausgewählte Nutzer in der Vorschau verfügbar, während das Veo 2-Videomodell erweiterte Bearbeitungs- und visuelle Effektoptionen erhält. Zusätzlich führte Google eine Stimmklonfunktion ein, die von Chirp 3, seinem Audioprozessormodell, unterstützt wird, für zugelassene Nutzer. Der Imagen 3-Bildgenerator bietet laut Google nun deutlich verbesserte Leistung.
Bei Cloud Next angekündigt, stärken diese Updates Googles Bestreben, den Markt für generative KI im Unternehmensbereich anzuführen, in direkter Konkurrenz zu Amazons Bedrock-Plattform, die ähnliche KI-Tools bereitstellt.
Google vermarktet Lyria als Ersatz für lizenzfreie Musikbibliotheken, die es Nutzern ermöglicht, Songs in verschiedenen Stilen zu produzieren, von Jazz-Piano-Solos bis hin zu Lo-Fi-Beats.
Chirp 3 unterstützt Sprachsynthese in etwa 35 Sprachen. Anfang dieses Jahres in der Vorschau vorgestellt, betreibt es Instant Custom Voice, das eine Stimme mit nur 10 Sekunden Audio nachbilden kann und nun allgemein verfügbar ist. Chirp 3 ermöglicht auch ein neues Vorschau-Tool, Transcription with Diarization, das Sprecher in Mehrpersonen-Aufnahmen unterscheidet und markiert.
Um Missbrauch zu verhindern, durchläuft Instant Custom Voice laut Google einen Verifizierungsprozess, um die korrekte Nutzung von Stimmen zu gewährleisten.
Veo 2 erlaubt es Nutzern nun, Hintergründe, Logos oder Objekte aus Videos zu entfernen und Videobilder zu erweitern, wie etwa die Umwandlung von Querformat- in Hochformat-Aufnahmen. Es unterstützt auch die Anpassung von Kamerawinkeln und Tempo für KI-generierte Szenen, die Erstellung von Effekten wie Zeitraffer oder Drohnenaufnahmen und kann zwischen festgelegten Start- und Endbildern interpolieren.
Diese Veo 2-Funktionen sind derzeit in der Vorschau.
Google betonte, dass die Verbesserungen von Imagen 3 seine Fähigkeit verbessern, Objekte zu entfernen und fehlende oder beschädigte Bildbereiche wiederherzustellen.
Alle von Imagen, Veo und Lyria (aber nicht Chirp) erstellten Medien tragen Googles SynthID-Wasserzeichen. Google betonte, dass seine generativen KI-Modelle Schutzmaßnahmen enthalten, um die Erstellung schädlicher Inhalte zu verhindern.
Google gab keine Details zu den Trainingsdaten seiner Modelle preis, ein Thema, das oft aufgrund von Urheberrechtsfragen diskutiert wird. Einige Unternehmen trainieren KI mit urheberrechtlich geschütztem Material ohne Erlaubnis und berufen sich auf den Fair-Use-Schutz in den USA, was jedoch häufig von Urhebern gerichtlich angefochten wird.
Google hatte TechCrunch zuvor mitgeteilt, dass es Opt-out-Optionen für das Modelltraining und eine Entschädigungsrichtlinie bietet, um Google Cloud- und Vertex AI-Nutzer vor urheberrechtlichen Ansprüchen im Zusammenhang mit KI zu schützen.
Verwandter Artikel
AI-gestützter Zauberer von Oz wird auf dem riesigen Bildschirm der Las Vegas Sphere glänzen
Sphere Entertainment hat kürzlich Pläne für eine immersive Neuinterpretation von Der Zauberer von Oz vorgestellt, die speziell für den einzigartigen Veranstaltungsort in Las Vegas angepasst wurde. Neu
Google enthüllt Android XR Smart Glasses, kooperiert mit Warby Parker
Google fordert die Ray-Ban Meta-Brillen von Meta mit neuen Kooperationen heraus, die auf der Google I/O 2025 angekündigt wurden, und arbeitet mit Gentle Monster und Warby Parker zusammen, um smarte Br
Apple erforscht die Integration von KI-Suche in Safari
Apple untersucht aktiv die Integration von KI-gestützten Suchfunktionen in Safari. Während des Kartellprozesses gegen Google am Mittwoch enthüllte Eddy Cue, Apples Senior Vice President of Services, P
Kommentare (0)
0/200
Am Mittwoch stellte Google Upgrades für seine Vertex AI-Cloud-Plattform vor, die mehrere proprietäre, medien-generierende KI-Modelle verbessern.
Lyria, Googles Text-zu-Musik-KI, ist nun für ausgewählte Nutzer in der Vorschau verfügbar, während das Veo 2-Videomodell erweiterte Bearbeitungs- und visuelle Effektoptionen erhält. Zusätzlich führte Google eine Stimmklonfunktion ein, die von Chirp 3, seinem Audioprozessormodell, unterstützt wird, für zugelassene Nutzer. Der Imagen 3-Bildgenerator bietet laut Google nun deutlich verbesserte Leistung.
Bei Cloud Next angekündigt, stärken diese Updates Googles Bestreben, den Markt für generative KI im Unternehmensbereich anzuführen, in direkter Konkurrenz zu Amazons Bedrock-Plattform, die ähnliche KI-Tools bereitstellt.
Google vermarktet Lyria als Ersatz für lizenzfreie Musikbibliotheken, die es Nutzern ermöglicht, Songs in verschiedenen Stilen zu produzieren, von Jazz-Piano-Solos bis hin zu Lo-Fi-Beats.
Chirp 3 unterstützt Sprachsynthese in etwa 35 Sprachen. Anfang dieses Jahres in der Vorschau vorgestellt, betreibt es Instant Custom Voice, das eine Stimme mit nur 10 Sekunden Audio nachbilden kann und nun allgemein verfügbar ist. Chirp 3 ermöglicht auch ein neues Vorschau-Tool, Transcription with Diarization, das Sprecher in Mehrpersonen-Aufnahmen unterscheidet und markiert.
Um Missbrauch zu verhindern, durchläuft Instant Custom Voice laut Google einen Verifizierungsprozess, um die korrekte Nutzung von Stimmen zu gewährleisten.
Veo 2 erlaubt es Nutzern nun, Hintergründe, Logos oder Objekte aus Videos zu entfernen und Videobilder zu erweitern, wie etwa die Umwandlung von Querformat- in Hochformat-Aufnahmen. Es unterstützt auch die Anpassung von Kamerawinkeln und Tempo für KI-generierte Szenen, die Erstellung von Effekten wie Zeitraffer oder Drohnenaufnahmen und kann zwischen festgelegten Start- und Endbildern interpolieren.
Diese Veo 2-Funktionen sind derzeit in der Vorschau.
Google betonte, dass die Verbesserungen von Imagen 3 seine Fähigkeit verbessern, Objekte zu entfernen und fehlende oder beschädigte Bildbereiche wiederherzustellen.
Alle von Imagen, Veo und Lyria (aber nicht Chirp) erstellten Medien tragen Googles SynthID-Wasserzeichen. Google betonte, dass seine generativen KI-Modelle Schutzmaßnahmen enthalten, um die Erstellung schädlicher Inhalte zu verhindern.
Google gab keine Details zu den Trainingsdaten seiner Modelle preis, ein Thema, das oft aufgrund von Urheberrechtsfragen diskutiert wird. Einige Unternehmen trainieren KI mit urheberrechtlich geschütztem Material ohne Erlaubnis und berufen sich auf den Fair-Use-Schutz in den USA, was jedoch häufig von Urhebern gerichtlich angefochten wird.
Google hatte TechCrunch zuvor mitgeteilt, dass es Opt-out-Optionen für das Modelltraining und eine Entschädigungsrichtlinie bietet, um Google Cloud- und Vertex AI-Nutzer vor urheberrechtlichen Ansprüchen im Zusammenhang mit KI zu schützen.











