Veo 3 startet mit KI-gesteuerter Video- und Soundtrack-Generierung

Heim

Nachricht

17. Oktober 2025

WalterSanchez

# Google

Veo 3 startet mit KI-gesteuerter Video- und Soundtrack-Generierung

Hier ist der umgeschriebene HTML-Inhalt, der alle Ihre Richtlinien befolgt:

Google stellt Veo 3 vor: KI-Videogenerierung mit synchronisiertem Audio

Google hat Veo 3 auf seiner I/O 2025 Konferenz vorgestellt und damit einen bedeutenden Fortschritt in der KI-generierten Videotechnologie markiert. Diese neueste Version fügt synchronisierte Audiogenerierung einschließlich Dialogen, Soundeffekten und Umgebungsgeräuschen hinzu, um die visuelle Ausgabe zu ergänzen.

Videoerstellung der nächsten Generation

Das aktualisierte Modell stellt eine dramatische Verbesserung gegenüber Veo 2 in Bezug auf die Ausgabequalität und -fähigkeit dar. Demis Hassabis, CEO von Google DeepMind, betonte, dass dieser Durchbruch bedeutet, dass "wir die stille Ära der Videoerstellung verlassen", indem wir den Erstellern die Möglichkeit geben, Dialoge und Umgebungsgeräusche über Texteingaben zu spezifizieren.

Verfügbarkeit und Preisgestaltung

Veo 3 ist derzeit über die Gemini-Chatbot-App von Google verfügbar und erfordert ein Abonnement des AI Ultra-Tarifs für 249,99 $/Monat. Benutzer können die Videoerstellung entweder mit Textbeschreibungen oder Referenzbildern einleiten.

Wettbewerberlandschaft

Der Markt für KI-Videoproduktion ist mit Angeboten von Startups wie Runway und Pika neben Tech-Giganten wie OpenAI zunehmend überfüllt. Google positioniert die automatische Audiosynchronisation von Veo 3 - bei der das System Videopixel interpretiert, um passende Töne zu erzeugen - als sein Hauptunterscheidungsmerkmal.

Technische Grundlagen

Diese Fähigkeit baut auf DeepMinds Video-zu-Audio-Forschung auf, die im vergangenen Juni vorgestellt wurde. Google hat zwar nicht den vollständigen Trainingsdatensatz von Veo 3 veröffentlicht, aber da Google Eigentümer der Plattform ist, dürften YouTube-Inhalte dazu beigetragen haben.

Sicherheitsmaßnahmen

Um Deepfake-Bedenken entgegenzuwirken, setzt Google seine SynthID-Wasserzeichentechnologie ein, um die Ergebnisse von Veo 3 mit unsichtbaren Identifikatoren zu versehen.

Auswirkungen auf die Branche

Auch wenn diese Tools den Urhebern mehr Möglichkeiten bieten, so werfen sie doch berechtigte Bedenken hinsichtlich einer Störung der Kreativbranche auf. Eine Studie der Animation Guild aus dem Jahr 2024 geht davon aus, dass bis zum Jahr 2026 mehr als 100.000 Arbeitsplätze in der US-Medienbranche von KI-bedingten Veränderungen betroffen sein könnten.

Veo 2-Verbesserungen

Gleichzeitig kündigte Google Verbesserungen für Veo 2 an, darunter eine verbesserte visuelle Konsistenz, ein besseres Verständnis von Kamerabewegungen, Objektmanipulationen und Frame-Anpassungsfunktionen. Diese Funktionen werden bald auf Googles Vertex AI API-Plattform ausgeweitet.

Verwandter Artikel

Google Gemini führt Vorlesefunktion für Docs ein Google Text & Tabellen führt eine innovative, KI-gestützte Text-to-Speech-Funktion ein, die geschriebene Dokumente in anpassbare Audioerlebnisse verwandelt. Die neue Funktion ermöglicht es den Nutzern

YouTube stellt kostenloses AI-Tool zur Erstellung von Video-Hintergrundmusik vor YouTube revolutioniert die Erstellung von Inhalten, indem es ein innovatives KI-Tool einführt, das lizenzfreie Instrumentalspuren generiert und damit Urheberrechtsprobleme für Videomacher beseitigt, w

Der KI-Modus der Google-Suche hilft jetzt bei der Visualisierung von Hausaufgaben Google erweitert seinen KI-Modus um bahnbrechende Funktionen, die speziell zur Unterstützung von Schülern bei akademischen Arbeiten und selbstgesteuertem Lernen entwickelt wurden. Das jüngste Update f

Kommentare (0)

0/200

Einreichen

Top -Nachrichten

Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen Gemini 2.5 Pro jetzt unbegrenzt und billiger als Claude, GPT-4O AI-Synchronisation: Ultimativer Leitfaden zur realistischen Stimmen-Erstellung AI Builder und Power Automate Revolutionieren die Dokumentenzusammenfassung Die KI von Cambium verwandelt Abfall Holz in Holz Duolingo wechselt zum Energiesystem OpenAI verbessert den AI -Sprachassistenten für bessere Chats So stellen Sie sicher, dass Ihre Daten für die KI -Integration vertrauenswürdig sind NotebookLM erweitert weltweit, fügt Folien und eine verbesserte Faktenprüfung hinzu Optimierungen an US -Rechenzentren könnten 76 GW neue Leistungskapazität freischalten

Mehr

Vorgestellt