Veo 3 startet mit KI-gesteuerter Video- und Soundtrack-Generierung

Hier ist der umgeschriebene HTML-Inhalt, der alle Ihre Richtlinien befolgt:
Google stellt Veo 3 vor: KI-Videogenerierung mit synchronisiertem Audio
Google hat Veo 3 auf seiner I/O 2025 Konferenz vorgestellt und damit einen bedeutenden Fortschritt in der KI-generierten Videotechnologie markiert. Diese neueste Version fügt synchronisierte Audiogenerierung einschließlich Dialogen, Soundeffekten und Umgebungsgeräuschen hinzu, um die visuelle Ausgabe zu ergänzen.
Videoerstellung der nächsten Generation
Das aktualisierte Modell stellt eine dramatische Verbesserung gegenüber Veo 2 in Bezug auf die Ausgabequalität und -fähigkeit dar. Demis Hassabis, CEO von Google DeepMind, betonte, dass dieser Durchbruch bedeutet, dass "wir die stille Ära der Videoerstellung verlassen", indem wir den Erstellern die Möglichkeit geben, Dialoge und Umgebungsgeräusche über Texteingaben zu spezifizieren.
Verfügbarkeit und Preisgestaltung
Veo 3 ist derzeit über die Gemini-Chatbot-App von Google verfügbar und erfordert ein Abonnement des AI Ultra-Tarifs für 249,99 $/Monat. Benutzer können die Videoerstellung entweder mit Textbeschreibungen oder Referenzbildern einleiten.
Wettbewerberlandschaft
Der Markt für KI-Videoproduktion ist mit Angeboten von Startups wie Runway und Pika neben Tech-Giganten wie OpenAI zunehmend überfüllt. Google positioniert die automatische Audiosynchronisation von Veo 3 - bei der das System Videopixel interpretiert, um passende Töne zu erzeugen - als sein Hauptunterscheidungsmerkmal.
Technische Grundlagen
Diese Fähigkeit baut auf DeepMinds Video-zu-Audio-Forschung auf, die im vergangenen Juni vorgestellt wurde. Google hat zwar nicht den vollständigen Trainingsdatensatz von Veo 3 veröffentlicht, aber da Google Eigentümer der Plattform ist, dürften YouTube-Inhalte dazu beigetragen haben.
Sicherheitsmaßnahmen
Um Deepfake-Bedenken entgegenzuwirken, setzt Google seine SynthID-Wasserzeichentechnologie ein, um die Ergebnisse von Veo 3 mit unsichtbaren Identifikatoren zu versehen.
Auswirkungen auf die Branche
Auch wenn diese Tools den Urhebern mehr Möglichkeiten bieten, so werfen sie doch berechtigte Bedenken hinsichtlich einer Störung der Kreativbranche auf. Eine Studie der Animation Guild aus dem Jahr 2024 geht davon aus, dass bis zum Jahr 2026 mehr als 100.000 Arbeitsplätze in der US-Medienbranche von KI-bedingten Veränderungen betroffen sein könnten.
Veo 2-Verbesserungen
Gleichzeitig kündigte Google Verbesserungen für Veo 2 an, darunter eine verbesserte visuelle Konsistenz, ein besseres Verständnis von Kamerabewegungen, Objektmanipulationen und Frame-Anpassungsfunktionen. Diese Funktionen werden bald auf Googles Vertex AI API-Plattform ausgeweitet.
Verwandter Artikel
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze
Google führt Gemini in Chrome in Indien ein
Am Mittwoch gab Google bekannt, dass es die Integration von Gemini in Chrome auf neue Regionen ausweitet, darunter Indien, Kanada und Neuseeland. Durch diese Einführung können Desktop-Nutzer über eine
YouTube weitet die KI-basierte Deepfake-Erkennung auf Politiker, Regierungsvertreter und Journalisten aus
Am Dienstag gab YouTube bekannt, dass es seine Deepfake-Erkennungstechnologie auf eine ausgewählte Gruppe von Regierungsbeamten, politischen Kandidaten und Journalisten ausweiten wird. Das Tool identi
Empfehlungen zu verwandten Spezialthemen
Kommentare (4)
Veo 3 adding sound is a game-changer! Makes AI videos feel way less robotic. Wonder how long until we see this tech in everyday vlogging apps? 🤔
Die automatische Soundtrack-Erstellung ist echt der Game-Changer! 🎬 Früher hat das stundenlange Bearbeitung gekostet, jetzt macht die KI das im Handumdrehen. Aber irgendwie gruselt es mich auch ein bisschen – was passiert, wenn solche Tools kreative Berufe komplett ersetzen? Die Demo-Videos sahen trotzdem mega beeindruckend aus!
Imagina um futuro onde criamos filmes completos só com prompts? Isso é incrível e assustador ao mesmo tempo. Como isso afetará produtores independentes? Será que a 'autoria' do som sincronizado ainda será nossa? 🤔 A tecnologia avança rápido, mas as leis e a ética parecem sempre ficar para trás.

Hier ist der umgeschriebene HTML-Inhalt, der alle Ihre Richtlinien befolgt:
Google stellt Veo 3 vor: KI-Videogenerierung mit synchronisiertem Audio
Google hat Veo 3 auf seiner I/O 2025 Konferenz vorgestellt und damit einen bedeutenden Fortschritt in der KI-generierten Videotechnologie markiert. Diese neueste Version fügt synchronisierte Audiogenerierung einschließlich Dialogen, Soundeffekten und Umgebungsgeräuschen hinzu, um die visuelle Ausgabe zu ergänzen.
Videoerstellung der nächsten Generation
Das aktualisierte Modell stellt eine dramatische Verbesserung gegenüber Veo 2 in Bezug auf die Ausgabequalität und -fähigkeit dar. Demis Hassabis, CEO von Google DeepMind, betonte, dass dieser Durchbruch bedeutet, dass "wir die stille Ära der Videoerstellung verlassen", indem wir den Erstellern die Möglichkeit geben, Dialoge und Umgebungsgeräusche über Texteingaben zu spezifizieren.
Verfügbarkeit und Preisgestaltung
Veo 3 ist derzeit über die Gemini-Chatbot-App von Google verfügbar und erfordert ein Abonnement des AI Ultra-Tarifs für 249,99 $/Monat. Benutzer können die Videoerstellung entweder mit Textbeschreibungen oder Referenzbildern einleiten.
Wettbewerberlandschaft
Der Markt für KI-Videoproduktion ist mit Angeboten von Startups wie Runway und Pika neben Tech-Giganten wie OpenAI zunehmend überfüllt. Google positioniert die automatische Audiosynchronisation von Veo 3 - bei der das System Videopixel interpretiert, um passende Töne zu erzeugen - als sein Hauptunterscheidungsmerkmal.
Technische Grundlagen
Diese Fähigkeit baut auf DeepMinds Video-zu-Audio-Forschung auf, die im vergangenen Juni vorgestellt wurde. Google hat zwar nicht den vollständigen Trainingsdatensatz von Veo 3 veröffentlicht, aber da Google Eigentümer der Plattform ist, dürften YouTube-Inhalte dazu beigetragen haben.
Sicherheitsmaßnahmen
Um Deepfake-Bedenken entgegenzuwirken, setzt Google seine SynthID-Wasserzeichentechnologie ein, um die Ergebnisse von Veo 3 mit unsichtbaren Identifikatoren zu versehen.
Auswirkungen auf die Branche
Auch wenn diese Tools den Urhebern mehr Möglichkeiten bieten, so werfen sie doch berechtigte Bedenken hinsichtlich einer Störung der Kreativbranche auf. Eine Studie der Animation Guild aus dem Jahr 2024 geht davon aus, dass bis zum Jahr 2026 mehr als 100.000 Arbeitsplätze in der US-Medienbranche von KI-bedingten Veränderungen betroffen sein könnten.
Veo 2-Verbesserungen
Gleichzeitig kündigte Google Verbesserungen für Veo 2 an, darunter eine verbesserte visuelle Konsistenz, ein besseres Verständnis von Kamerabewegungen, Objektmanipulationen und Frame-Anpassungsfunktionen. Diese Funktionen werden bald auf Googles Vertex AI API-Plattform ausgeweitet.
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze
Google führt Gemini in Chrome in Indien ein
Am Mittwoch gab Google bekannt, dass es die Integration von Gemini in Chrome auf neue Regionen ausweitet, darunter Indien, Kanada und Neuseeland. Durch diese Einführung können Desktop-Nutzer über eine
YouTube weitet die KI-basierte Deepfake-Erkennung auf Politiker, Regierungsvertreter und Journalisten aus
Am Dienstag gab YouTube bekannt, dass es seine Deepfake-Erkennungstechnologie auf eine ausgewählte Gruppe von Regierungsbeamten, politischen Kandidaten und Journalisten ausweiten wird. Das Tool identi
Veo 3 adding sound is a game-changer! Makes AI videos feel way less robotic. Wonder how long until we see this tech in everyday vlogging apps? 🤔
Die automatische Soundtrack-Erstellung ist echt der Game-Changer! 🎬 Früher hat das stundenlange Bearbeitung gekostet, jetzt macht die KI das im Handumdrehen. Aber irgendwie gruselt es mich auch ein bisschen – was passiert, wenn solche Tools kreative Berufe komplett ersetzen? Die Demo-Videos sahen trotzdem mega beeindruckend aus!
Imagina um futuro onde criamos filmes completos só com prompts? Isso é incrível e assustador ao mesmo tempo. Como isso afetará produtores independentes? Será que a 'autoria' do som sincronizado ainda será nossa? 🤔 A tecnologia avança rápido, mas as leis e a ética parecem sempre ficar para trás.





Heim






