NVIDIA stellt Lyra 2.0 vor, das aus einzelnen Bildern weitläufige 3D-Szenen erzeugt

Am 16. April 2026 stellte das Forschungsteam von NVIDIA offiziell Lyra 2.0 vor, ein System zur Erzeugung von 3D-Szenen. Diese Technologie erstellt aus einem einzigen Foto weitläufige, hochgradig kohärente virtuelle Umgebungen und löst damit effektiv das Problem der Bildverzerrung bei langen Kamerabewegungen. Angesichts der wachsenden Nachfrage nach Training für verkörperte KI stellt Lyra 2.0 einen bedeutenden Durchbruch in der Fähigkeit der KI dar, den 3D-Raum zu verstehen und Umgebungen in Echtzeit zu simulieren.
Technisch gesehen kann Lyra 2.0 aus einem einzigen Bild 3D-Umgebungen generieren, die sich bis zu 90 Meter erstrecken. Um der räumlichen Verzerrung und der Fehlerakkumulation entgegenzuwirken, die durch das „Vergessen“ in traditionellen Videomodellen verursacht werden, haben die Forscher zwei wichtige Innovationen implementiert. Das System speichert 3D-Geometriedaten für jedes Einzelbild in Echtzeit und gewährleistet so die Konsistenz der Umgebung, wenn die Kamera frühere Orte erneut besucht. Es trainiert zudem mit fehlerhaften Ausgabedaten, wodurch das Modell Selbstkorrektur erlernen kann. Benchmark-Tests zeigen, dass Lyra2.0 sechs Konkurrenzmodelle, darunter GEN3C und Yume-1.5, in Bezug auf Bildqualität und Kamerasteuerung übertrifft, während seine schnelle Version die Generierungseffizienz um das 13-Fache steigert.
Lyra2.0 lässt sich nun nahtlos in Physik-Engines wie Nvidia Isaac Sim integrieren, sodass generierte 3D-Szenen direkt als Mesh-Modelle exportiert werden können. Dieser geschlossene Arbeitsablauf ermöglicht es Robotern, effizientes Simulationstraining in KI-generierten Umgebungen durchzuführen, wodurch der Bedarf an groß angelegter 3D-Datenerfassung in der realen Welt drastisch reduziert wird. Obwohl derzeit auf statische Szenen beschränkt, bieten die Fortschritte von Lyra2.0 in Bezug auf Generierungsumfang und Stabilität eine robustere und innovativere Infrastruktur für die Weiterentwicklung der physischen Wahrnehmung bei autonomen Fahrzeugen und Allzweckrobotern (AGI).
Verwandter Artikel
Talats KI-Besprechungsnotizen werden auf Ihrem Gerät gespeichert, nicht in der Cloud
Granola, die KI-gestützte Notiz-App mit einem Unternehmenswert von 250 Millionen Dollar, hat bei Tech-Gründern und Risikokapitalgebern an Beliebtheit gewonnen. Ein Entwickler sieht jedoch Bedarf an ei
Der neue Roewe i6 kommt für 659.000 Yuan auf den Markt – mit Snapdragon 8155 und dem „Doubao“-Großmodell
SAIC Roewe hat heute den neuen Roewe i6 vorgestellt, eine Kompaktlimousine, die die Designsprache des Roewe D7 vollständig aufgreift. Der markante, große, senkrechte Kühlergrill und die horizontale Li
Wie kann man Vermögenswerte, Gebäude und die eigene Gesundheit schützen?
In einer unvorhersehbaren Welt ist Schutz zu einer strategischen Notwendigkeit geworden – und nicht mehr nur eine Option. Ob es um die Absicherung der Finanzen, die Stärkung von Gebäuden oder die Pfle
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Am 16. April 2026 stellte das Forschungsteam von NVIDIA offiziell Lyra 2.0 vor, ein System zur Erzeugung von 3D-Szenen. Diese Technologie erstellt aus einem einzigen Foto weitläufige, hochgradig kohärente virtuelle Umgebungen und löst damit effektiv das Problem der Bildverzerrung bei langen Kamerabewegungen. Angesichts der wachsenden Nachfrage nach Training für verkörperte KI stellt Lyra 2.0 einen bedeutenden Durchbruch in der Fähigkeit der KI dar, den 3D-Raum zu verstehen und Umgebungen in Echtzeit zu simulieren.
Technisch gesehen kann Lyra 2.0 aus einem einzigen Bild 3D-Umgebungen generieren, die sich bis zu 90 Meter erstrecken. Um der räumlichen Verzerrung und der Fehlerakkumulation entgegenzuwirken, die durch das „Vergessen“ in traditionellen Videomodellen verursacht werden, haben die Forscher zwei wichtige Innovationen implementiert. Das System speichert 3D-Geometriedaten für jedes Einzelbild in Echtzeit und gewährleistet so die Konsistenz der Umgebung, wenn die Kamera frühere Orte erneut besucht. Es trainiert zudem mit fehlerhaften Ausgabedaten, wodurch das Modell Selbstkorrektur erlernen kann. Benchmark-Tests zeigen, dass Lyra2.0 sechs Konkurrenzmodelle, darunter GEN3C und Yume-1.5, in Bezug auf Bildqualität und Kamerasteuerung übertrifft, während seine schnelle Version die Generierungseffizienz um das 13-Fache steigert.
Lyra2.0 lässt sich nun nahtlos in Physik-Engines wie Nvidia Isaac Sim integrieren, sodass generierte 3D-Szenen direkt als Mesh-Modelle exportiert werden können. Dieser geschlossene Arbeitsablauf ermöglicht es Robotern, effizientes Simulationstraining in KI-generierten Umgebungen durchzuführen, wodurch der Bedarf an groß angelegter 3D-Datenerfassung in der realen Welt drastisch reduziert wird. Obwohl derzeit auf statische Szenen beschränkt, bieten die Fortschritte von Lyra2.0 in Bezug auf Generierungsumfang und Stabilität eine robustere und innovativere Infrastruktur für die Weiterentwicklung der physischen Wahrnehmung bei autonomen Fahrzeugen und Allzweckrobotern (AGI).
Talats KI-Besprechungsnotizen werden auf Ihrem Gerät gespeichert, nicht in der Cloud
Granola, die KI-gestützte Notiz-App mit einem Unternehmenswert von 250 Millionen Dollar, hat bei Tech-Gründern und Risikokapitalgebern an Beliebtheit gewonnen. Ein Entwickler sieht jedoch Bedarf an ei
Der neue Roewe i6 kommt für 659.000 Yuan auf den Markt – mit Snapdragon 8155 und dem „Doubao“-Großmodell
SAIC Roewe hat heute den neuen Roewe i6 vorgestellt, eine Kompaktlimousine, die die Designsprache des Roewe D7 vollständig aufgreift. Der markante, große, senkrechte Kühlergrill und die horizontale Li
Wie kann man Vermögenswerte, Gebäude und die eigene Gesundheit schützen?
In einer unvorhersehbaren Welt ist Schutz zu einer strategischen Notwendigkeit geworden – und nicht mehr nur eine Option. Ob es um die Absicherung der Finanzen, die Stärkung von Gebäuden oder die Pfle





Heim






