Googles Gemini AI enthüllt eine Funktion zur Umwandlung von Fotos in Videos
Das neueste Gemini-Update von Google führt eine bahnbrechende Foto-zu-Video-Konvertierung ein, die auf dem Veo 3-Modell basiert. Diese innovative Funktion wandelt statische Bilder in acht Sekunden lange Videoclips um, die mit KI-generierten Audioelementen wie Umgebungsgeräuschen, Hintergrundgeräuschen und sogar synthetischer Sprache angereichert sind. Die Webversion wird derzeit für Gemini Ultra- und Pro-Abonnenten in ausgewählten Regionen eingeführt, die mobile Version folgt diese Woche.
Details zur Implementierung
Die neue Animationsfunktion lässt sich nahtlos in den bestehenden Workflow von Gemini integrieren. Die Benutzer aktivieren die Funktion durch:
- Auswahl der Option "Werkzeuge" in der Benutzeroberfläche
- Auswählen des Erstellungsmodus "Video".
- Hochladen ihres Quellbildes und Angabe von Bewegungsanweisungen
- Optionales Hinzufügen von Audiobeschreibungen für Dialoge und Umgebungsgeräusche

Technische Spezifikationen
Das System liefert bearbeitete Videos mit diesen technischen Parametern:
- Dateiformat: MP4-Container
- Auflösung: 720p HD
- Bildseitenverhältnis: 16:9 Querformat
- Dauer: 8 Sekunden feste Länge
Kreative Anwendungen
Google stellt mehrere überzeugende Anwendungsfälle für die Technologie vor:
- Illustrationen und Gemälden Leben einhauchen
- Unbelebte Objekte mit Persönlichkeit versehen
- Hinzufügen dynamischer Bewegung zu Landschaftsaufnahmen

Authentifizierung von Inhalten
Alle generierten Videos enthalten ein duales Wasserzeichensystem:
- Sichtbares Wasserzeichen, das die Herkunft der KI anzeigt
- Eingebettetes digitales SynthID-Wasserzeichen zur Verifizierung
Erweiterung der Plattform
Während ähnliche Funktionen zuvor in Googles eigenständiger Flow-Anwendung vorhanden waren, bringt diese Integration die Animationstools direkt in das Gemini-Ökosystem. Gleichzeitig kündigt Google eine erhebliche geografische Ausweitung von Flow an, so dass das Tool für die Filmerstellung in 75 weiteren Ländern parallel zur Einführung von Geminis Videofunktionen verfügbar ist.

Zugänglichkeit und Verfügbarkeit
Die schrittweise Freigabe der Funktion folgt diesem Zeitplan:
- Web-Einführung: Sofortige Verfügbarkeit
- Mobile Bereitstellung: Rollout innerhalb der laufenden Woche
- Abonnement erforderlich: Gemini Ultra/Pro Tier in unterstützten Regionen
Verwandter Artikel
Notion verwandelt seinen Arbeitsbereich in eine Drehscheibe für KI-Agenten
Notion, der Anbieter von Produktivitätssoftware, tritt in das Zeitalter der agentenbasierten Lösungen ein.Während einer live gestreamten Produktankündigung am Mittwoch stellte Notion – bekannt für sei
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Das neueste Gemini-Update von Google führt eine bahnbrechende Foto-zu-Video-Konvertierung ein, die auf dem Veo 3-Modell basiert. Diese innovative Funktion wandelt statische Bilder in acht Sekunden lange Videoclips um, die mit KI-generierten Audioelementen wie Umgebungsgeräuschen, Hintergrundgeräuschen und sogar synthetischer Sprache angereichert sind. Die Webversion wird derzeit für Gemini Ultra- und Pro-Abonnenten in ausgewählten Regionen eingeführt, die mobile Version folgt diese Woche.
Details zur Implementierung
Die neue Animationsfunktion lässt sich nahtlos in den bestehenden Workflow von Gemini integrieren. Die Benutzer aktivieren die Funktion durch:
- Auswahl der Option "Werkzeuge" in der Benutzeroberfläche
- Auswählen des Erstellungsmodus "Video".
- Hochladen ihres Quellbildes und Angabe von Bewegungsanweisungen
- Optionales Hinzufügen von Audiobeschreibungen für Dialoge und Umgebungsgeräusche

Technische Spezifikationen
Das System liefert bearbeitete Videos mit diesen technischen Parametern:
- Dateiformat: MP4-Container
- Auflösung: 720p HD
- Bildseitenverhältnis: 16:9 Querformat
- Dauer: 8 Sekunden feste Länge
Kreative Anwendungen
Google stellt mehrere überzeugende Anwendungsfälle für die Technologie vor:
- Illustrationen und Gemälden Leben einhauchen
- Unbelebte Objekte mit Persönlichkeit versehen
- Hinzufügen dynamischer Bewegung zu Landschaftsaufnahmen

Authentifizierung von Inhalten
Alle generierten Videos enthalten ein duales Wasserzeichensystem:
- Sichtbares Wasserzeichen, das die Herkunft der KI anzeigt
- Eingebettetes digitales SynthID-Wasserzeichen zur Verifizierung
Erweiterung der Plattform
Während ähnliche Funktionen zuvor in Googles eigenständiger Flow-Anwendung vorhanden waren, bringt diese Integration die Animationstools direkt in das Gemini-Ökosystem. Gleichzeitig kündigt Google eine erhebliche geografische Ausweitung von Flow an, so dass das Tool für die Filmerstellung in 75 weiteren Ländern parallel zur Einführung von Geminis Videofunktionen verfügbar ist.

Zugänglichkeit und Verfügbarkeit
Die schrittweise Freigabe der Funktion folgt diesem Zeitplan:
- Web-Einführung: Sofortige Verfügbarkeit
- Mobile Bereitstellung: Rollout innerhalb der laufenden Woche
- Abonnement erforderlich: Gemini Ultra/Pro Tier in unterstützten Regionen
Notion verwandelt seinen Arbeitsbereich in eine Drehscheibe für KI-Agenten
Notion, der Anbieter von Produktivitätssoftware, tritt in das Zeitalter der agentenbasierten Lösungen ein.Während einer live gestreamten Produktankündigung am Mittwoch stellte Notion – bekannt für sei
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
Auf der Google I/O 2026 wird die Sprachsteuerung für den Gmail-Posteingang vorgestellt
Google integriert weiterhin KI in Ihren Posteingang. Auf der Entwicklerkonferenz IO 2026 am Dienstag hat das Unternehmen seine Gmail-Funktion „AI Inbox“ um dialogorientierte KI erweitert, sodass Nutze





Heim






