Veo 3 startet mit KI-gesteuerter Video- und Soundtrack-Generierung

Hier ist der umgeschriebene HTML-Inhalt, der alle Ihre Richtlinien befolgt:
Google stellt Veo 3 vor: KI-Videogenerierung mit synchronisiertem Audio
Google hat Veo 3 auf seiner I/O 2025 Konferenz vorgestellt und damit einen bedeutenden Fortschritt in der KI-generierten Videotechnologie markiert. Diese neueste Version fügt synchronisierte Audiogenerierung einschließlich Dialogen, Soundeffekten und Umgebungsgeräuschen hinzu, um die visuelle Ausgabe zu ergänzen.
Videoerstellung der nächsten Generation
Das aktualisierte Modell stellt eine dramatische Verbesserung gegenüber Veo 2 in Bezug auf die Ausgabequalität und -fähigkeit dar. Demis Hassabis, CEO von Google DeepMind, betonte, dass dieser Durchbruch bedeutet, dass "wir die stille Ära der Videoerstellung verlassen", indem wir den Erstellern die Möglichkeit geben, Dialoge und Umgebungsgeräusche über Texteingaben zu spezifizieren.
Verfügbarkeit und Preisgestaltung
Veo 3 ist derzeit über die Gemini-Chatbot-App von Google verfügbar und erfordert ein Abonnement des AI Ultra-Tarifs für 249,99 $/Monat. Benutzer können die Videoerstellung entweder mit Textbeschreibungen oder Referenzbildern einleiten.
Wettbewerberlandschaft
Der Markt für KI-Videoproduktion ist mit Angeboten von Startups wie Runway und Pika neben Tech-Giganten wie OpenAI zunehmend überfüllt. Google positioniert die automatische Audiosynchronisation von Veo 3 - bei der das System Videopixel interpretiert, um passende Töne zu erzeugen - als sein Hauptunterscheidungsmerkmal.
Technische Grundlagen
Diese Fähigkeit baut auf DeepMinds Video-zu-Audio-Forschung auf, die im vergangenen Juni vorgestellt wurde. Google hat zwar nicht den vollständigen Trainingsdatensatz von Veo 3 veröffentlicht, aber da Google Eigentümer der Plattform ist, dürften YouTube-Inhalte dazu beigetragen haben.
Sicherheitsmaßnahmen
Um Deepfake-Bedenken entgegenzuwirken, setzt Google seine SynthID-Wasserzeichentechnologie ein, um die Ergebnisse von Veo 3 mit unsichtbaren Identifikatoren zu versehen.
Auswirkungen auf die Branche
Auch wenn diese Tools den Urhebern mehr Möglichkeiten bieten, so werfen sie doch berechtigte Bedenken hinsichtlich einer Störung der Kreativbranche auf. Eine Studie der Animation Guild aus dem Jahr 2024 geht davon aus, dass bis zum Jahr 2026 mehr als 100.000 Arbeitsplätze in der US-Medienbranche von KI-bedingten Veränderungen betroffen sein könnten.
Veo 2-Verbesserungen
Gleichzeitig kündigte Google Verbesserungen für Veo 2 an, darunter eine verbesserte visuelle Konsistenz, ein besseres Verständnis von Kamerabewegungen, Objektmanipulationen und Frame-Anpassungsfunktionen. Diese Funktionen werden bald auf Googles Vertex AI API-Plattform ausgeweitet.
Verwandter Artikel
Google Gemini führt Vorlesefunktion für Docs ein
Google Text & Tabellen führt eine innovative, KI-gestützte Text-to-Speech-Funktion ein, die geschriebene Dokumente in anpassbare Audioerlebnisse verwandelt. Die neue Funktion ermöglicht es den Nutzern
YouTube stellt kostenloses AI-Tool zur Erstellung von Video-Hintergrundmusik vor
YouTube revolutioniert die Erstellung von Inhalten, indem es ein innovatives KI-Tool einführt, das lizenzfreie Instrumentalspuren generiert und damit Urheberrechtsprobleme für Videomacher beseitigt, w
Der KI-Modus der Google-Suche hilft jetzt bei der Visualisierung von Hausaufgaben
Google erweitert seinen KI-Modus um bahnbrechende Funktionen, die speziell zur Unterstützung von Schülern bei akademischen Arbeiten und selbstgesteuertem Lernen entwickelt wurden. Das jüngste Update f
Kommentare (0)
0/200
Hier ist der umgeschriebene HTML-Inhalt, der alle Ihre Richtlinien befolgt:
Google stellt Veo 3 vor: KI-Videogenerierung mit synchronisiertem Audio
Google hat Veo 3 auf seiner I/O 2025 Konferenz vorgestellt und damit einen bedeutenden Fortschritt in der KI-generierten Videotechnologie markiert. Diese neueste Version fügt synchronisierte Audiogenerierung einschließlich Dialogen, Soundeffekten und Umgebungsgeräuschen hinzu, um die visuelle Ausgabe zu ergänzen.
Videoerstellung der nächsten Generation
Das aktualisierte Modell stellt eine dramatische Verbesserung gegenüber Veo 2 in Bezug auf die Ausgabequalität und -fähigkeit dar. Demis Hassabis, CEO von Google DeepMind, betonte, dass dieser Durchbruch bedeutet, dass "wir die stille Ära der Videoerstellung verlassen", indem wir den Erstellern die Möglichkeit geben, Dialoge und Umgebungsgeräusche über Texteingaben zu spezifizieren.
Verfügbarkeit und Preisgestaltung
Veo 3 ist derzeit über die Gemini-Chatbot-App von Google verfügbar und erfordert ein Abonnement des AI Ultra-Tarifs für 249,99 $/Monat. Benutzer können die Videoerstellung entweder mit Textbeschreibungen oder Referenzbildern einleiten.
Wettbewerberlandschaft
Der Markt für KI-Videoproduktion ist mit Angeboten von Startups wie Runway und Pika neben Tech-Giganten wie OpenAI zunehmend überfüllt. Google positioniert die automatische Audiosynchronisation von Veo 3 - bei der das System Videopixel interpretiert, um passende Töne zu erzeugen - als sein Hauptunterscheidungsmerkmal.
Technische Grundlagen
Diese Fähigkeit baut auf DeepMinds Video-zu-Audio-Forschung auf, die im vergangenen Juni vorgestellt wurde. Google hat zwar nicht den vollständigen Trainingsdatensatz von Veo 3 veröffentlicht, aber da Google Eigentümer der Plattform ist, dürften YouTube-Inhalte dazu beigetragen haben.
Sicherheitsmaßnahmen
Um Deepfake-Bedenken entgegenzuwirken, setzt Google seine SynthID-Wasserzeichentechnologie ein, um die Ergebnisse von Veo 3 mit unsichtbaren Identifikatoren zu versehen.
Auswirkungen auf die Branche
Auch wenn diese Tools den Urhebern mehr Möglichkeiten bieten, so werfen sie doch berechtigte Bedenken hinsichtlich einer Störung der Kreativbranche auf. Eine Studie der Animation Guild aus dem Jahr 2024 geht davon aus, dass bis zum Jahr 2026 mehr als 100.000 Arbeitsplätze in der US-Medienbranche von KI-bedingten Veränderungen betroffen sein könnten.
Veo 2-Verbesserungen
Gleichzeitig kündigte Google Verbesserungen für Veo 2 an, darunter eine verbesserte visuelle Konsistenz, ein besseres Verständnis von Kamerabewegungen, Objektmanipulationen und Frame-Anpassungsfunktionen. Diese Funktionen werden bald auf Googles Vertex AI API-Plattform ausgeweitet.












